1. 資料載入儲存指令
lddquxmm, m128
從非對齊的記憶體位址中載入128位數到xmm暫存器,此條指令比sse2的非對齊載入指令movdqu要快。
movddup
xmm, xmm/m64
載入64bit資料到xmm暫存器的低64位,同時複製到其高64位。
movshdup
xmm, xmm/m128
只需複製第二與第四個32位元素從而把資料讀入到接收暫存器中
movsldup
xmm, xmm/m128
只需複製第一和第三個32位元素從而把資料讀入到接收暫存器中
2.算術指令
addsubpd - (
add-subtract-packed-double)
雙精度浮點高位加法,低位減法
addsubps - (add-subtract-packed-single)
單精度浮點高位加法,低位減法。
輸入: ,
輸出:
3. 陣列結構指令(array of structures;aos)
SSE2指令集系列之二
本小結描述的是sse2整數運算指令。5.資料搬移指令 movdqa xmm,xmm m128 movdqa xmm m128,xmm 把源儲存器內容值送入目的暫存器,當有m128時,記憶體位址必須16位元組對齊.movdqu xmm,xmm m128 movdqu xmm m128,xmm 把源儲存...
SSE2指令集系列之一
sse2與sse1使用相同暫存器,指令描述約定 mm指64位mmx暫存器 xmm指128xmm暫存器 m32 指32位記憶體變數 m128指128位記憶體變數 sse2主要是雙精度浮點運算指令 1.資料搬移指令 movapd xmm,xmm m128 movapd xmm m128,xmm 把源儲存...
SSE2指令集系列之一 浮點運算指令
sse2與sse1使用相同暫存器,指令描述約定 mm指64位mmx暫存器 xmm指128xmm暫存器 m32 指32位記憶體變數 m128指128位記憶體變數 本小結主要描述雙精度浮點運算指令 1.資料搬移指令 movapdxmm,xmm m128 movapdxmm m128,xmm 把源儲存器內...