ToDo:
http://shinh.skr.jp/m/?date=20220102#c01
バカモデルってどのくらいの精度なの?
と聞いていただいたので
まず、親バカ的な回答としては「うちの子は常軌を逸してかわいいので写ってれば精度100%です」となる。けど、そうは言っても特別良いシーンを切り抜くために涙を飲んで「かわいくない」とアノテーションしたシーンもたくさんあって、データを train/val split した場合 70% くらいの精度が出てた。同日同条件撮影が train/val 両方に入ってるので、ドメインがリークしてる状態で 70% はとても低い気がするけど、まあ、指摘いただいた通り、かわいいvsかわいくない、は非常に曖昧なんで、かわいくないことになってる教師データをかわいいと分類されたら、「これは教師データ作る時にミスったんだな……」となる
まあそもそも用途的に精度はたぶん、そんなに重要でない。やりたいことは良い写真の選択でなくて、動画から良いシーンを切り抜いてくることで、1フレームごとの精度はたいして重要じゃなくて、このへんふわっとかわいい判定続いてるな、て場所がわかれば十分なので。まあとはいえ写ってないシーン、暗すぎるシーン、寝てるシーン、あたりはほぼかわいい判定されない感じにはなっている
で、実物がこんな感じ。抽出された90分の動画はたぶん不規則発言とか入ってて、アップロードには不向きなので、ランダムに2秒*20シーンを切り取ってきた。他人の赤子の写真見せられるほど興味持てないことがないのは知ってるけど、これは研究発表だから、しょうがないね。なんか途中泣いてるとこ入っちゃったので音量注意
参考までに同じスクリプトで保存されている全動画からランダムサンプルしてきた動画(ちょっと期間がずれてるけど)。これ見るとわかるけど、そもそも写ってない時間が多くて、写っても寝てたりするんで、それらを捨てた上で割といいとこ切ってくれてると感じるので、かなり機能してると言っていいんじゃないかな、と思っている
次は声出してるシーンを切り抜いてくる、てのをやりたいなと
(13:36)
グーグル: 「アリスはエンジニアです。私といっしょにプログラムを開発しています。」→"Alice is an engineer. He is developing a program with me."
DeepL: 「アリスはエンジニアです。私といっしょにプログラムを開発しています。」→"Alice is an engineer. She is working with me to develop a program."
グーグル: 「アリスは看護師です。私といっしょにプログラムを開発しています。」→"Alice is a nurse. She is developing a program with me."
グーグル: 「ボブはエンジニアとして最高の評価を受けているアリスの夫です。私といっしょにプログラムを開発しています。」→"Bob is Alice's husband, who has the highest reputation as an engineer. I am developing a program with me."
DeepL: 「ボブはエンジニアとして最高の評価を受けているアリスの夫です。私といっしょにプログラムを開発しています。」→"Bob is Alice's husband, who has the highest reputation as an engineer. She is working with me to develop a program."
うーん
(08:21)
https://gitlab.com/ase/ase/-/blob/master/ase/test/md/test_md.py#L29
この手のコメント大好物
(08:59)
https://wiki.fysik.dtu.dk/ase/ase/md.html
を見ればわかりやすかった。一番実装がややこしい NPT の説明があまりないけど……
雑にまとめると
Berendsen 二種が普通に考えるとそうするよねって実装に思える、がなんか正しくないらしい
(16:13)
15日間で保存した 60GB くらいの動画のうち 40GB くらいを捨てて、残り 20GB から 360MB くらい切り出してきて、1時間半くらいの動画にまとめてくれた
ほどよい感じかな。もうちょっと短くしてくれても良いのかも
(15:27)
最近、改行を伴う時は文末に句点打たないようにしてて、なんとなく最後の「。」が嫌いだったので快適。 Ruby などの、文が一行に複数ある時は置いて良いよ、というセパレータとしての句点になった
最近、と思ったけど、ここを二分探索したら5年くらい前から割とそんな感じだった
(11:47)
出産&育児開始で概ね記憶がリセットされた感がある一年だった。その前ってどんな生活してたんだっけ……?
東京の23区外、ほぼ埼玉の一軒家に引越したのも大きい変化だった。たまーに東京に出たくなると不便だけど、それ以外はとても快適な場所で、とても良い。一軒家もいいけど、うーんどうなんだろ?て思ってたけど、買うのも普通にアリだなあこれは、という心境の変化があった
仕事はまあそれなりにがんばっていたと思う。そういえば副業というのを始めてみたりもした。副業は、普通に楽しげではあるんだけど、楽しさレベルでは本業が圧倒的に強いんだよな……
本業の方は、 MN-Core が少しずつ実用されつつあるというのが、なかなか感慨がある。独自モデルを独自チップで使ってる会社なんて、小さいところではたぶん世界中に存在しない気がするし、大変楽しい感じではある。しかもモデルもチップも既存のものをちょっといじったレベルじゃない独自性の高さだし。この業界独自性の高いほげほげとか死亡フラグでしかないのは知っているが、まあ個人としては楽しいので良い
まあまだまだ本気の速度出てないし、ちょっと想定と外れると使い勝手最悪というか使えない、みたいな状態なんで、やらんといけないことはいっぱいあるのだけど……
来年の抱負としては、現状維持したいということがある。育児の負荷が大変高いので不可能なゴールではあるが、なるべく育児以外の生活の質を保ちたい
(14:09)
_ ma [最後の「。」が嫌いだと小学館の漫画読むのつらそう]
シェルスクリプトが実行中に編集されると途中で変わるやつのせいで起きたらしい
https://www.iimc.kyoto-u.ac.jp/services/comp/pdf/file_loss_insident_20211228.pdf
と、いつも通りのことを思った
(00:19)
妻が泣きやむらしい、という怪情報を拾ってきて動画を見せてくれたのだけど、理解できないものを信じない僕は「偶然じゃないの」と思っていたんだけど、試してみたら瞬殺で泣きやんでびびった
https://www.youtube.com/watch?v=V1HCT9TqS2c
覚醒させて泣きやませるというのはなるほどという感じ
(22:01)
育児をしている。子供は予想された通り、予想以上にかわいい。ちょっとなんだこれってレベルでかわいい。が、だからといって育児が楽しいかというと、楽しくない。正確に言うと、 20% くらい楽しいのだけど、とはいえ拘束時間の長さ、単純作業感、挙動の理不尽さ、などがどうしても勝ってしまう
育児、やる前はなんとなく「おむつかえとか大変そう」とか思っていたが、やってみるとおむつかえは最もラクな部類のタスクであった。一番楽しいのは沐浴。ミルクやりが一番つらかったが、隣に寝っころがって片手でミルク瓶ささえて、片手で baba is you という技を発明して、つらくなくなった。ラクすることばかり考えていて申し訳なさもあるが、親の精神安定ほど子に良いものも無いんじゃないかな、って思想なので良いこととしている
今はあやしてるのが一番つらい。座ってると腰いたくなってくるし、立って揺らしてると片手で他のことできないし、別にほっておいても成長はするだろうし、ほっといた方が良いという話もあるし、あやしてても泣く時は泣くしで、達成感のなさもすごい
生後1ヶ月だと状態が「寝ている」「泣いている」「きばっている」「機嫌が良い(ちょっとレア)」の2bitくらいしか無くて、もうちょっと親にご褒美をくれーとなる。順調にいって、笑ったりしてくれると、いろいろと報われる感があるんじゃないかな
育児に取られる時間はなかなかすごいが、とはいえ育休中なので、割と時間はある。普通にまあまあコード書いてたりするし、マンガとか読むし、 baba is you もやってるし、ちょっと仕事の slack にコメントしてみたりもする。メリハリをつけたいという嗜好がなくて、休み中に仕事するのと、仕事中にサボるのが好きなんだよな
時間があるので、バカみたいに撮影しまくってる写真や動画を使って、かわいく写っているのを自動で集める、親バカモデルを作ったりしている。超簡単な作りで、 MobileNetV3 small の出力を 3 値にして、「かわいい」「かわいくない」「写ってない」に分類するだけ。適当にラベルつけるツールを書いて自分で写真や動画から切り出した画像を分類して、今ある学習データは500枚くらいで、ちょっとずつ増やしていく予定
見守りカメラで24時間ベッドを監視し、かわいいコマが一定量続いた区間の動画を保存する、みたいなのを作っている。まだ色々書かないといけないコードがあるが、実験してる感じ、割とうまくいきそう
エッジでトレーニングする話、ベンチマークのしにくさや、品質保証できないぷりから、あまりうまくいくと思ってないんだけど、こいう用途だと良いかも、と思った。高めの見守りカメラだと危険の検知や、良い写真のサジェストとかしてくれるのは知ってるんだけど、親が我が子にラベルをつけて我が子専用のAIを育てて、親バカ写真/動画集を作る、てのがゲームぽさがあって、楽しむ人は結構いそう。品質保証のできなさも気にならないし
(23:33)
日本に来た邦人の隔離うんぬんで、 GAFA 的会社にいたり出身だったりな国内エンジニアと、シリコンバレーの在外邦人的なエンジニアが、バトルぽくなっててちょっと面白かった。いつもは比較的似たような主張をしてそうな人たちなのに
在外邦人の人達は、いきなり航空券売らない指示とか、隔離環境厳しすぎひどい、移動権!とか言っていて、日本国内の人は、国内の人も色々と不便しているのだ、移動権への多少の制約は当然で、がまんしてほしい、みたいな感じだろうか
これはなんというか、どっちも正しいことを言っているというか、伝わってるべき情報が伝わってない印象があった。いや、個々で見ると、それはどうなん?と思った発言もあったけど
在外邦人の人たちは、極端な話ビザ切れる人とか、帰らんと困る人が明らかにいるのに、一律で航空券予約停止とかはおかしいわけで、それを含めて、在外邦人の扱いがあまりに軽いことに抗議している側面が強いのかなあと。「隔離とか協力したくない好きに帰らせろ移動権!」て人はいなかったように思うし、まあそこはたぶん前提すぎてあまり語られなかったので、国内の人からすると、なんか苦難のタイミングに自由に帰らせろってギャーギャー言ってる、みたいな気持ちになったのかな
逆に国内の人は、在外邦人の人が「不要不急だろうが好きに帰ってきて隔離とかもイヤ!」と主張している前提、みたいな雰囲気があったように思う。まあそういうアグレッシブな人もいるのかもしれないけど、ほとんどの人は、常識的な待遇下で一定の制限を受けることは納得してると考えるのが自然そうだったかなと
「事情無視の完全封鎖はひどい」「隔離するならある程度人道的な扱いを」「行動に制約かけるなら、やりかたに意味があるとした根拠を説明してほしい」など、普通に考えて当たり前の主張だと思う。なんかでも一方で「これだから日本は」式の揶揄も見られた気がして反発を招いたのかなとも思ったり、揶揄のひとつもしたくなるような扱いよねえとも思ったり
(17:06)
前 | 2024年 11月 |
次 | ||||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
全てリンクフリーです。 コード片は自由に使用していただいて構いません。 その他のものはGPL扱いであればあらゆる使用に関して文句は言いません。 なにかあれば下記メールアドレスへ。
_ ma [なるほどー自分が欲しいのはどっちかってゆーと「大量のに撮った写真の中から特に良いのを取ってくる」みたいので、特にかわ..]
_ shinh [> 見るの? まあ、データてのは使うかわかんなくてもとりあえず残しておけば良いんじゃないかと。キーボード入力も..]