c語言程式設計 效能優化

2021-07-25 11:28:48 字數 3161 閱讀 8934

使用巨集定義

在c語言中,巨集是產生內嵌**的唯一方法。對於嵌入式系統而言,為了能達到效能要求,巨集是一種很好的代替函式的方法。

寫乙個"標準"巨集min ,這個巨集輸入兩個引數並返回較小的乙個:

錯誤做法:

#define min(a,b)  ( a <= b ? a : b )

正確做法:

#define min(a,b) ((a)<= (b) ? (a) : (b) )

對於巨集,我們需要知道三點:

(1)巨集定義"像"函式;

(2)巨集定義不是函式,因而需要括上所有"引數";

(3)巨集定義可能產生***。

下面的**:

least = min(*p++, b);

將被替換為:

( (*p++) <= (b) ?(*p++):(b) )

發生的事情無法預料。

因而不要給巨集定義傳入有***的"引數"。

使用暫存器變數

當對乙個變數頻繁被讀寫時,需要反覆訪問記憶體,從而花費大量的訪問時間。為此,c語言提供了一種變數,即暫存器變數。這種變數存放在cpu的暫存器中,使用時,不需要訪問記憶體,而直接從暫存器中讀寫,從而提高效率。暫存器變數的說明符是register。對於迴圈次數較多的迴圈控制變數及迴圈體內反覆使用的變數均可定義為暫存器變數,而迴圈計數是應用暫存器變數的最好候選者。

(1) 只有區域性自動變數和形參才可以定義為暫存器變數。因為暫存器變數屬於動態儲存方式,凡需要採用靜態儲存方式的量都不能定義為暫存器變數,包括:模組間全域性變數、模組內全域性變數、區域性static變數;

(2) register是乙個"建議"型關鍵字,意指程式建議該變數放在暫存器中,但最終該變數可能因為條件不滿足並未成為暫存器變數,而是被放在了儲存器中,但編譯器中並不報錯(在c++語言中有另乙個"建議"型關鍵字:inline)。

下面是乙個採用暫存器變數的例子:

/* 求1+2+3+….+n的值 */

word addition(byte n)

return s;}

本程式迴圈n次,i和s都被頻繁使用,因此可定義為暫存器變數。

內嵌彙編

程式中對時間要求苛刻的部分可以用內嵌彙編來重寫,以帶來速度上的顯著提高。但是,開發和測試彙編**是一件辛苦的工作,它將花費更長的時間,因而要慎重選擇要用彙編的部分。

在程式中,存在乙個80-20原則,即20%的程式消耗了80%的執行時間,因而我們要改進效率,最主要是考慮改進那20%的**。

/* 把兩個輸入引數的值相加,結果存放到另外乙個全域性變數中 */

int result;

void add(long a, long *b) }

利用硬體特性

首先要明白cpu對各種儲存器的訪問速度,基本上是:

cpu內部ram > 外部同步ram > 外部非同步ram > flash/rom

對於程式**,已經被燒錄在flash或rom中,我們可以讓cpu直接從其中讀取**執行,但通常這不是乙個好辦法,我們最好在系統啟動後將flash或rom中的目標**拷貝入ram中後再執行以提高取指令速度;

對於uart等裝置,其內部有一定容量的接收buffer,我們應盡量在buffer被佔滿後再向cpu提出中斷。例如計算機終端在向目標機通過rs-232傳遞資料時,不宜設定uart只接收到乙個byte就向cpu提中斷,從而無謂浪費中斷處理時間;

如果對某裝置能採取dma方式讀取,就採用dma讀取,dma讀取方式在讀取目標中包含的儲存資訊較大時效率較高,其資料傳輸的基本單位是塊,而所傳輸的資料是從裝置直接送入記憶體的(或者相反)。dma方式較之中斷驅動方式,減少了cpu 對外設的干預,進一步提高了cpu與外設的並行操作程度。

活用位操作

使用c語言的位操作可以減少除法和取模的運算。在電腦程式中資料的位是可以操作的最小資料單位,理論上可以用"位運算"來完成所有的運算和操作,因而,靈活的位操作可以有效地提高程式執行的效率。舉例如下:

/* 方法1 */

int i,j;

i = 879 / 16;

j = 562 % 32;

/* 方法2 */

int i,j;

i = 879 >> 4;

j = 562 - (562 >> 5 << 5);

對於以2的指數次方為"*"、"/"或"%"因子的數**算,轉化為移位運算"<< >>"通常可以提高演算法效率。因為乘除運算指令週期通常比移位運算大。

c語言位運算除了可以提高運算效率外,在嵌入式系統的程式設計中,它的另乙個最典型的應用,而且十分廣泛地正在被使用著的是位間的與(&)、或(|)、非(~)操作,這跟嵌入式系統的程式設計特點有很大關係。我們通常要對硬體暫存器進行位設定,譬如,我們通過將am186er型80186處理器的中斷遮蔽控制暫存器的第低6位設定為0(開中斷2),最通用的做法是:

#define int_i2_mask 0x0040

wtemp = inword(int_mask);

outword(int_mask, wtemp &~int_i2_mask);

而將該位設定為1的做法是:

#define int_i2_mask 0x0040

wtemp = inword(int_mask);

outword(int_mask, wtemp | int_i2_mask);

判斷該位是否為1的做法是:

#define int_i2_mask 0x0040

wtemp = inword(int_mask);

if(wtemp & int_i2_mask)

上述方法在嵌入式系統的程式設計中是非常常見的,我們需要牢固掌握。

總結

在效能優化方面永遠注意80-20準備,不要優化程式中開銷不大的那80%,這是勞而無功的。

巨集定義是c語言中實現類似函式功能而又不具函式呼叫和返回開銷的較好方法,但巨集在本質上不是函式,因而要防止巨集展開後出現不可預料的結果,對巨集的定義和使用要慎而處之。很遺憾,標準c至今沒有包括c++中inline函式的功能,inline函式兼具無呼叫開銷和安全的優點。

使用暫存器變數、內嵌彙編和活用位操作也是提高程式效率的有效方法。

除了程式設計上的技巧外,為提高系統的執行效率,我們通常也需要最大可能地利用各種硬體裝置自身的特點來減小其運轉開銷,例如減小中斷次數、利用dma傳輸方式等。

C語言效能優化

1 資料型別 1 如果確定整數非負,應直接使用unsigned int,處理器處理無符號unsigned 整形數的效率遠遠高於有符號signed整形數 2 float可以用int替代,如果需要結果精確到小數點後n位,可以將其乘以n 10,結果盡可能晚的把它轉換為浮點型數字 3 區域性變數盡可能的不使...

C語言程式設計 演算法優化

相信大多數計算機學者或從事與之相關工作的朋友都聽過這麼一句話 演算法是程式的靈魂。從這句話中我們就可以看到演算法在程式設計中的重要性。簡單來說,演算法 algorithm 是指完成乙個任務所需要的具體步驟和方法。也就是說給定初始狀態或輸入資料,能夠得出所要求或期望的終止狀態或輸出資料。在乙個c語言程...

cuda程式設計 效能優化

做了幾個月的gpu的效能優化,一直沒來得及總結,先把大概要點總結一下,後面有空進行進一步完善。tesla v100 cuda 9.0 linux c 資料格式要進行設計,把每個部分精簡至最小,減少對gpu視訊記憶體的占用,同時縮小資料的比對時間。從記憶體load到快取,減少load的時間消耗,可採用...