<< 16/66 >>
First Last

SIMD: 4倍

やるだけ

GCC は SIMD 命令を吐けない

spu-gcc は vector 型や asm と対応した組み込み関数を持っている

    y2_v =                                                              \
        spu_xor(spu_rlmask(y_v, rshift_one),                            \
                spu_shuffle(*(vector unsigned int*)&mtp[O],             \
                            *(vector unsigned int*)&mtp[O+4],           \
                            shift_pattern));                            \

なぜか 4 倍以上になる