volatile提醒編譯器它後面所定義的變數隨時都有可能改變,因此編譯後的程式每次需要儲存或讀取這個變數的時候,都會直接從變數位址中讀取資料。如果沒有volatile關鍵字,則編譯器可能優化讀取和儲存,可能暫時使用暫存器中的值,如果這個變數由別的程式更新了的話,將出現不一致的現象。下面舉例說明。在dsp開發中,經常需要等待某個事件的觸發,所以經常會寫出這樣的程式:
short flag;
void test()
這段程式等待記憶體變數flag的值變為1(懷疑此處是0,有點疑問,)之後才執行do2()。變數flag的值由別的程式更改,這個程式可能是某個硬體中斷服務程式。例如:如果某個按鈕按下的話,就會對dsp產生中斷,在按鍵中斷程式中修改flag為1,這樣上面的程式就能夠得以繼續執行。但是,編譯器並不知道flag的值會被別的程式修改,因此在它進行優化的時候,可能會把flag的值先讀入某個暫存器,然後等待那個暫存器變為1。如果不幸進行了這樣的優化,那麼while迴圈就變成了死迴圈,因為暫存器的內容不可能被中斷服務程式修改。為了讓程式每次都讀取真正flag變數的值,就需要定義為如下形式:
volatile short flag;
需要注意的是,沒有volatile也可能能正常執行,但是可能修改了編譯器的優化級別之後就又不能正常執行了。因此經常會出現debug版本正常,但是release版本卻不能正常的問題。所以為了安全起見,只要是等待別的程式修改某個變數的話,就加上volatile關鍵字。
volatile的本意是「易變的」
由於訪問暫存器的速度要快過ram,所以編譯器一般都會作減少訪問外部ram的優化。比如:
static int i=0;
int main(void)
}/* interrupt service routine. */
void isr_2(void)
程式的本意是希望isr_2中斷產生時,在main當中呼叫do_something函式,但是,由於編譯器判斷在main函式裡面沒有修改過i,因此可能只執行一次對從i到某暫存器的讀操作,然後每次if判斷都只使用這個暫存器裡面的「i副本」,導致do_something永遠也不會被呼叫。如果變數加上volatile修飾,則編譯器保證對此變數的讀寫操作都不會被優化(肯定執行)。此例中i也應該如此說明。
一般說來,volatile用在如下的幾個地方:
1、中斷服務程式中修改的供其它程式檢測的變數需要加volatile;
2、多工環境下各任務間共享的標誌應該加volatile;
3、儲存器對映的硬體暫存器通常也要加volatile說明,因為每次對它的讀寫都可能由不同意義;
另外,以上這幾種情況經常還要同時考慮資料的完整性(相互關聯的幾個標誌讀了一半被打斷了重寫),在1中可以通過關中斷來實現,2中可以禁止任務排程,3中則只能依靠硬體的良好設計了。
二、volatile 的含義
volatile總是與優化有關,編譯器有一種技術叫做資料流分析,分析程式中的變數在**賦值、在**使用、在**失效,分析結果可以用於常量合併,常量傳播等優化,進一步可以死**消除。但有時這些優化不是程式所需要的,這時可以用volatile關鍵字禁止做這些優化,volatile的字面含義是易變的,它有下面的作用:
1 不會在兩個操作之間把volatile變數快取在暫存器中。在多工、中斷、甚至setjmp環境下,變數可能被其他的程式改變,編譯器自己無法知道,volatile就是告訴編譯器這種情況。
2 不做常量合併、常量傳播等優化,所以像下面的**:
volatile int i = 1;
if (i > 0) ...
if的條件不會當作無條件真。
前面有人說volatile可以保證對記憶體操作的原子性,這種說法不大準確,其一,x86需要lock字首才能在smp下保證原子性,其二,risc根本不能對記憶體直接運算,要保證原子性得用別的方法,如atomic_inc。
對於jiffies,它已經宣告為volatile變數,我認為直接用jiffies++就可以了,沒必要用那種複雜的形式,因為那樣也不能保證原子性。
你可能不知道在pentium及後續cpu中,下面兩組指令
inc jiffies
;; mov jiffies, %eax
inc %eax
mov %eax, jiffies
作用相同,但一條指令反而不如三條指令快。
三、編譯器優化 → c關鍵字volatile → memory破壞描述符zz
「memory」比較特殊,可能是內嵌彙編中最難懂部分。為解釋清楚它,先介紹一下編譯器的優化知識,再看c關鍵字volatile。最後去看該描述符。
1、編譯器優化介紹
記憶體訪問速度遠不及cpu處理速度,為提高機器整體效能,在硬體上引入硬體快取記憶體cache,加速對記憶體的訪問。另外在現代cpu中指令的執行並不一定嚴格按照順序執行,沒有相關性的指令可以亂序執行,以充分利用cpu的指令流水線,提高執行速度。以上是硬體級別的優化。再看軟體一級的優化:一種是在編寫**時由程式設計師優化,另一種是由編譯器進行優化。編譯器優化常用的方法有:將記憶體變數快取到暫存器;調整指令順序充分利用cpu指令流水線,常見的是重新排序讀寫指令。對常規記憶體進行優化的時候,這些優化是透明的,而且效率很好。由編譯器優化或者硬體重新排序引起的問題的解決辦法是在從硬體(或者其他處理器)的角度看必須以特定順序執行的操作之間設定記憶體屏障(memory barrier),linux 提供了乙個巨集解決編譯器的執行順序問題。
void barrier(void)
這個函式通知編譯器插入乙個記憶體屏障,但對硬體無效,編譯後的**會把當前cpu暫存器中的所有修改過的數值存入記憶體,需要這些資料的時候再重新從記憶體中讀出。
2、c語言關鍵字volatile
c語言關鍵字volatile(注意它是用來修飾變數而不是上面介紹的__volatile__)表明某個變數的值可能在外部被改變,因此對這些變數的訪問不能快取到暫存器,每次使用時需要重新訪問。該關鍵字在多執行緒環境下經常使用,因為在編寫多執行緒的程式時,同乙個變數可能被多個執行緒修改,而程式通過該變數同步各個執行緒,例如:
dword __stdcall threadfunc(lpvoid signal)
該執行緒啟動時將intsignal 置為2,然後迴圈等待直到intsignal 為1 時退出。顯然intsignal的值必須在外部被改變,否則該執行緒不會退出。但是實際執行的時候該執行緒卻不會退出,即使在外部將它的值改為1,看一下對應的偽彙編**就明白了:
mov ax,signal
label:
if(ax!=1)
goto label
對於c編譯器來說,它並不知道這個值會被其他執行緒修改。自然就把它cache在暫存器裡面。記住,c 編譯器是沒有執行緒概念的!這時候就需要用到volatile。volatile 的本意是指:這個值可能會在當前執行緒外部被改變。也就是說,我們要在threadfunc中的intsignal前面加上volatile關鍵字,這時候,編譯器知道該變數的值會在外部改變,因此每次訪問該變數時會重新讀取,所作的迴圈變為如下面偽碼所示:
label:
mov ax,signal
if(ax!=1)
goto label
3、memory
有了上面的知識就不難理解memory修改描述符了,memory描述符告知gcc:
1)不要將該段內嵌彙編指令與前面的指令重新排序;也就是在執行內嵌彙編**之前,它前面的指令都執行完畢
2)不要將變數快取到暫存器,因為這段**可能會用到記憶體變數,而這些記憶體變數會以不可預知的方式發生改變,因此gcc插入必要的**先將快取到暫存器的變數值寫回記憶體,如果後面又訪問這些變數,需要重新訪問記憶體。
如果彙編指令修改了記憶體,但是gcc 本身卻察覺不到,因為在輸出部分沒有描述,此時就需要在修改描述部分增加「memory」,告訴gcc 記憶體已經被修改,gcc 得知這個資訊後,就會在這段指令之前,插入必要的指令將前面因為優化cache 到暫存器中的變數值先寫回記憶體,如果以後又要使用這些變數再重新讀取。
使用「volatile」也可以達到這個目的,但是我們在每個變數前增加該關鍵字,不如使用「memory」方便。
詳解C中volatile關鍵字
volatile提醒編譯器它後面所定義的變數隨時都有可能改變,因此編譯後的程式每次需要儲存或讀取這個變數的時候,都會直接從變數位址中讀取資料。如果沒有volatile關鍵字,則編譯器可能優化讀取和儲存,可能暫時使用暫存器中的值,如果這個變數由別的程式更新了的話,將出現不一致的現象。下面舉例說明。在d...
詳解C中volatile關鍵字
volatile提醒編譯器它後面所定義的變數隨時都有可能改變,因此編譯後的程式每次需要儲存或讀取這個變數的時候,都會直接從變數位址中讀取資料。如果沒有volatile關鍵字,則編譯器可能優化讀取和儲存,可能暫時使用暫存器中的值,如果這個變數由別的程式更新了的話,將出現不一致的現象。下面舉例說明。在d...
詳解C中volatile關鍵字
來自 volatile提醒編譯器它後面所定義的變數隨時都有可能改變,因此編譯後的程式每次需要儲存或讀取這個變數的時候,都會直接從變數位址中讀取資料。如果沒有volatile關鍵字,則編譯器可能優化讀取和儲存,可能暫時使用暫存器中的值,如果這個變數由別的程式更新了的話,將出現不一致的現象。下面舉例說明...