アノテーションと呼ばれ、誰もが苦心する部分。

adobeで出来るらしいが、容量制限がありそうなのでパス。ローカルがいい。
ビデオアセットのスマートタグ | Adobe Experience Manager

アノテーションで良ければLabel Studioが使えるが、そんな時間は無い。
GitHub - HumanSignal/label-studio: Label Studio is a multi-type data labeling and annotation tool with standardized output format

Digikamで可能という話があるが、それは何かの理由で辞めたような……

NextCloudだとMemoriesが使える。
GitHub - pulsejet/memories: Fast, modern and advanced photo management suite. Runs as a Nextcloud app.

wd1.4をそのまま使えばいい気がする。
あった。
Image/Video Booru Tagger (WD14 + DeepDanbooru + E621) - v4.4 | Stable Diffusion Other | Civitai

では音声は

真面目に点けるならmp3tag、onetaggerという選択肢も
onetaggerにはタグをショートカットキーに割り当て一気につけていく機能がある
GitHub - Marekkon5/onetagger: Music tagger for Windows, MacOS and Linux with Beatport, Discogs, Musicbrainz, Spotify, Traxsource and many other platforms support.

DISCO AI Auto-Taggingが近いが、やはり有料

onetaggerにゆくゆく追加されるかもしれない
AI to clean auto tag of genres? · Issue 412 · Marekkon5/onetagger · GitHub