はじめてのにき(2022-01-08)

2022-01-08

_ 親バカモデル結果サンプル

http://shinh.skr.jp/m/?date=20220102#c01

バカモデルってどのくらいの精度なの？

と聞いていただいたので

まず、親バカ的な回答としては「うちの子は常軌を逸してかわいいので写ってれば精度100%です」となる。けど、そうは言っても特別良いシーンを切り抜くために涙を飲んで「かわいくない」とアノテーションしたシーンもたくさんあって、データを train/val split した場合 70% くらいの精度が出てた。同日同条件撮影が train/val 両方に入ってるので、ドメインがリークしてる状態で 70% はとても低い気がするけど、まあ、指摘いただいた通り、かわいいvsかわいくない、は非常に曖昧なんで、かわいくないことになってる教師データをかわいいと分類されたら、「これは教師データ作る時にミスったんだな……」となる

まあそもそも用途的に精度はたぶん、そんなに重要でない。やりたいことは良い写真の選択でなくて、動画から良いシーンを切り抜いてくることで、1フレームごとの精度はたいして重要じゃなくて、このへんふわっとかわいい判定続いてるな、て場所がわかれば十分なので。まあとはいえ写ってないシーン、暗すぎるシーン、寝てるシーン、あたりはほぼかわいい判定されない感じにはなっている

で、実物がこんな感じ。抽出された90分の動画はたぶん不規則発言とか入ってて、アップロードには不向きなので、ランダムに2秒*20シーンを切り取ってきた。他人の赤子の写真見せられるほど興味持てないことがないのは知ってるけど、これは研究発表だから、しょうがないね。なんか途中泣いてるとこ入っちゃったので音量注意

参考までに同じスクリプトで保存されている全動画からランダムサンプルしてきた動画(ちょっと期間がずれてるけど)。これ見るとわかるけど、そもそも写ってない時間が多くて、写っても寝てたりするんで、それらを捨てた上で割といいとこ切ってくれてると感じるので、かなり機能してると言っていいんじゃないかな、と思っている

次は声出してるシーンを切り抜いてくる、てのをやりたいなと

(13:36)

_ あとそうだ

↑のような短い動画を作るのであれば、 recall を落としまくって良いので、たぶん、もっといい感じにすることもできると思う

(13:55)

本日のツッコミ(全2件) [ツッコミを入れる]

_ ma (2022-01-08 14:46)

なるほどー自分が欲しいのはどっちかってゆーと「大量のに撮った写真の中から特に良いのを取ってくる」みたいので、特にかわいい写真が false negative で弾かれると悲しいなとか思っていたけど、ベビーモニター動画から抜くってのならそこまで精度関係ないのかな。でもそれ本当に見るの？という疑問は置いておいて。。。しかし子供動き始めたらベビーモニター動画って寝相だけになるんじゃないのかって気がするけど家中カバーできるようにカメラ増設すれば解決するか。

それより「バカモデル」っていうコピペミス？がなかなか面白いなと思った。

_ shinh (2022-01-08 18:06)

> 見るの？

まあ、データてのは使うかわかんなくてもとりあえず残しておけば良いんじゃないかと。キーボード入力も何にも使ってないけど10年以上残ってる……

> 動いたら

カメラの向きはプログラムで制御できるんで、たぶんトラッキングは実装すればできると思ってます

コピペミスはひどい……

ツッコミ・コメントがあればどうぞ! E-mailアドレスは公開されません。

全てリンクフリーです。コード片は自由に使用していただいて構いません。その他のものはGPL扱いであればあらゆる使用に関して文句は言いません。なにかあれば下記メールアドレスへ。


		2022年 1月
日	月	火	水	木	金	土
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31