Vector演算の高速化

レンダラが重いので、SIMDを使ってVectorの演算部分を書き直したのだが・・・。テストしてみると、超遅い。外積を求める演算を100000回させたら、SIMD使って無い方が1ms。でSIMDで書いた奴は15ms・・・。
シャッフルを多用したり、水平演算を噛ましてるのが遅くなってる原因なんだろうか?どの道、使えねえので捨てるか。

他の高速化手法としては、テンプレートを使ったExpression Templateとかが在るようなので、そっちも試してみよう。