トップ «前の日記(2023-05-01) 最新 次の日記(2023-05-05)» 編集

はじめてのにき

ここの位置付け

2004|11|
2005|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|09|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|05|06|07|08|09|10|11|12|
2015|01|02|03|04|05|06|07|08|09|10|11|12|
2016|01|02|03|04|05|06|07|08|09|10|11|12|
2017|01|02|03|04|05|06|07|08|09|10|11|12|
2018|01|02|03|04|05|06|07|08|09|10|11|12|
2019|01|02|03|04|05|06|07|08|09|10|11|12|
2020|01|02|03|04|05|06|07|08|09|10|11|12|
2021|01|02|03|04|05|06|07|08|09|10|11|12|
2022|01|02|03|04|05|06|07|08|09|10|11|12|
2023|01|02|03|04|05|06|07|08|09|10|11|12|
2024|01|02|03|04|

ToDo:


2023-05-03

_ Mojo

https://docs.modular.com/mojo/

うーむ。なんかこうプログラム言語を楽しく思う気持ちがすりへってしまっているな。 swift ではなにがダメだったんだろう

(15:04)

_ LLM に思ったこと

http://shinh.skr.jp/m/?date=20230326#p01

では使う方面側だったので、技術よりな感想

パラメータを増やせば性能が上がる、というのは、かなり楽しくない。速いメモリがたくさん必要です、以上のことにならないので……特に学習側はどうなんだろうねえ。推論の方はマシというか、バカみたいにあるパラメータを圧縮する話になると、学習側も楽しそうではある

圧縮と言っても、データ圧縮がんばるぞ、てよりは、現状の LLM だと、少ないパラメータ量をコスパ良く使うような構造を発見するところからなんだろうけど……方向性としていろいろありそうだけど

  • CNN みたいな再利用。画素みたいに自明な方向はないので、同じ重みを複数のチャンネルグループに使う、とかなのかねえ
  • 重みを明示的に再利用する。 RNN 以外であまりうまくいったイメージがないけど
  • factorize する系
  • 重みがあるのはしょうがないが、条件次第で読まない。つまり MoE
  • それ系で言うとやっぱ決定木的なやつとのハイブリッドをやって欲しいけど。決定木って圧縮効率高いよねえたぶん

データ圧縮がんばるぞ系でいうと、本質的に符号と仮数部がおおむねランダムなので、なんというか難しいよな。いや非可逆圧縮は単に仮数分の下捨てればいいのはシンプルなんだけど。えーと例えば、指数部が小さいデータの仮数部は捨てる、とかどうなんだろう

(16:43)

お名前:
E-mail:
コメント:
人生、宇宙、すべての答え

2023年
5月
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
1.shinh(2023-06-02 06:24) 2.にわさき(2023-05-18 00:24)
search / home / index

全てリンクフリーです。 コード片は自由に使用していただいて構いません。 その他のものはGPL扱いであればあらゆる使用に関して文句は言いません。 なにかあれば下記メールアドレスへ。

shinichiro.hamaji _at_ gmail.com / shinichiro.h