矩陣 浮點運算測試報告

2021-03-31 08:56:32 字數 524 閱讀 5766

1)使用d3dxmatrixmultiply進行矩陣相乘

2)使用優化的4元數演算法模擬矩陣相乘(相乘的結果與1相同)

3)最笨的辦法計算矩陣相乘(要算64個乘法、48個加法、以及若干賦值)

4)使用sse彙編計算矩陣相乘(要算64個乘法、48個加法、以及若干賦值)

5)使用xmmintrin指令集計算矩陣相乘

結果表明:

1)最快,估計不僅指令進行了優化,演算法也進行了優化

2)是1的4~5倍,與3相比,證明演算法起了作用

3)是1的10倍左右

4)與3差不多,我ft,這是為什麼?我明明用的是彙編啊?怎麼速度一點也沒快!!!

5)與4差不多。

經驗教訓:

1)不能直接宣告float[4] f這樣的浮點陣列,由於對其問題,在組合語言中執行不了,應該這樣宣告__declspec(align(16)) float[4] f; 或者這樣宣告

union sse4 ;

2)那麼矩陣就是這樣宣告的了:

union sse16 ;

ARM 浮點運算,軟浮點,硬浮點

很多時候我們要處理的資料,不僅僅是整數和字串,還有浮點數即小數。在多 資料處理方面表現的更多。是不是所有的cpu都支援,浮點運算呢?答案 不是。我們常常聽到贏浮點和軟浮點,這些到底說的是什麼呢?下面我們就來一 竟吧。在這裡我們說的是arm核浮點運算。1 硬浮點 hard float 編譯器將 直接編...

ARM 浮點運算

很多時候我們要處理的資料,不僅僅是整數和字串,還有浮點數即小數。在多 資料處理方面表現的更多。是不是所有的cpu都支援,浮點運算呢?答案 不是。我們常常聽到贏浮點和軟浮點,這些到底說的是什麼呢?下面我們就來一 竟吧。在這裡我們說的是arm核浮點運算。1 硬浮點 hard float 編譯器將 直接編...

ARM 浮點運算

很多時候我們要處理的資料,不僅僅是整數和字串,還有浮點數即小數。在多 資料處理方面表現的更多。是不是所有的cpu都支援,浮點運算呢?答案 不是。我們常常聽到贏浮點和軟浮點,這些到底說的是什麼呢?下面我們就來一 竟吧。在這裡我們說的是arm核浮點運算。1 硬浮點 hard float 編譯器將 直接編...

浮點運算 NaN Infinaty

jls 4.2.4 p40 1 gradual underflow 精度不能滿足,導致下溢。2 round toward zero 從浮點強轉成整型的時候向零看趨近,找到最接近的整數。3 0.0 0.0 is not a number。4 比較運算子 返回false,只要有一個運算元是nan。5 對...

cpu設計之浮點運算單元 浮點加法運算

cpu中的運算單元包括 儲存執行,整形執行,浮點執行三個單元,其中浮點運算國內以前做的特別少,原因主要有2個,一是國內對精度的要求並沒有那麼高,二是浮點運算單元有點難度。今天在這裡主要介紹一 下浮點加法運算的過程 浮點運算單元最難的三個模組就是浮點加法,浮點乘法,除法運算 首先國內外現在用的浮點的格...