計算一幅影象的畫素值的平均值
測試環境:
cpu: intel(r)_core(tm)_i7-7700_cpu_@_3.60ghz
x 8gpu: nvidia geforce gtx 1050
1,在cuda gpu上計算累加和,先分段計算,在進行規約,分段計算裡面其實也是規約,然後除以總的畫素個數。
2,在cpu上序列計算累加和,再除以總的畫素個數。
3,在cpu上使用omp進行並行化。
對於1024x1024大小的影象資料,在保證結果正確一致的前提下,比較計算耗時,結果如下:
可以看出,最快的是cuda gpu,其次是omp並行化之後的程式,最慢的是序列計算。
**可參考:
序列IO與並行IO的效率比較
mpi file read at函式與c語言中的fread函式,依次讀取乙個100m的檔案,讀取時間如下所示 實驗一 zhangyang mpi002 kmeans exper mpiexec np 1 mpi c fspeed there are 1500015 samples.start tes...
序列計算機與平行計算 併發計算的比較
原文 從序列到並行,從並行到分布式 假設有ab兩個任務,則序列 並行 併發的區別如圖1所示。序列 a和b兩個任務執行在乙個cpu執行緒上,在a任務執行完之前不可以執行b。即,在整個程式的執行過程中,僅存在乙個執行上下文,即乙個呼叫棧乙個堆。程式會按順序執行每個指令。並行 並行性指兩個或兩個以上事件或...
序列 並行程式在效率上的簡單比較
分類 multi x 2010 10 15 10 33 1198人閱讀 收藏舉報 parallel 工作程式開發 作業語言測試 開頭 這是老師在開學時布置的一道作業題目,完整問題為 多核與單核的cpu在執行序列 並行程式時時,在效率上的差別。以前雖然常常聽說多核,但是卻沒有去多了解下並行程式和序列程...