首页 > 其他 > 详细

SSE求解向量大小

时间:2014-05-30 20:18:11      阅读:617      评论:0      收藏:0      [点我收藏+]
bubuko.com,布布扣
    float f=0;
        __asm
        {
            mov    esi,   this            ; vector u
            movups xmm0,  [esi]           ; first vector in xmm0
            mulps  xmm0,  xmm0            ; mul with 2nd vector
            movaps xmm1,  xmm0            ; copy result
            shufps xmm1,  xmm1, 4Eh       ; shuffle: f1,f0,f3,f2
            addps  xmm0,  xmm1            ; add: f3+f1,f2+f0,f1+f3,f0+f2 
            movaps xmm1,  xmm0            ; copy results
            shufps xmm1,  xmm1, 11h       ; shuffle: f0+f2,f1+f3,f0+f2,f1+f3 
            addps  xmm0,  xmm1            ; add: x,x,f0+f1+f2+f3,f0+f1+f2+f3
            sqrtss xmm0,  xmm0            ; sqroot from least bit value
            movss  f, xmm0                ; move result from xmm0 to edi
        }
bubuko.com,布布扣

x, y, z, w平方后,利用shufps将4个分量凑成相加结果为x方+y方+z方+w方,最后开方,取xmm寄存器的一个分量即是结果,取的xmm寄存器的低32位。

SSE求解向量大小,布布扣,bubuko.com

SSE求解向量大小

原文:http://www.cnblogs.com/seebro/p/3760108.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!