ToDo:
マラソンの最中にこれをざっくり読んだ。
http://info.psu.edu.sa/psu/cis/mtounsi/~CS311/paper-10.pdf
LZSS みたいなやつの、ハッシュテーブルひいた後で、完全マッチで見るんじゃなくて、 edit distance 的なある程度の変更(編集、削除、追加)を許すことで、 DNA に対して普通の LZ とかに比べて良くなるよ、という話。
ただ、サイトに置いてあった .exe はマラソンのデータに対してはイマイチ縮まんどころか1文字あたり2bitに負けてみたり、デカいデータ喰わせるとクラッシュしてみたり(これは wine が悪いのかもだが)と、どうもイマイチだった。
しかしまぁ DNA ってヤツは似たようなパターンだけど少し違う、ってデータが結構来るわけで、アイデアは面白いと思う。他に適用できそうな対象が typo だらけの文章とかしか思いつかないけど…
(00:20)
前 | 2012年 2月 |
次 | ||||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 |
全てリンクフリーです。 コード片は自由に使用していただいて構いません。 その他のものはGPL扱いであればあらゆる使用に関して文句は言いません。 なにかあれば下記メールアドレスへ。