厳密な edit distance を求める必要はなくて、なるべくたくさんの組み合わせについて edit distance が小さそうなものを探したいだけだったので、真ん中の方だけ計算してそれっぽい結果を高速に出す方が良いようだった
計算範囲広げてもあんまり結果良くならなかった(気がする)ので、64bit 程度の幅を計算すれば十分で SSE すら登場させる必要がなかった…
ちなみに edit distance じゃない、組み合わせをもりもり作る部分は SSE 化したみたい
あんま覚えてません
でも速度2倍になったよ、って書いてありますね…