首先我們先看看下面的c語言的結構體:
typedef struct memalign
memalign;
以上這個結構體占用記憶體多少空間呢?也許你會說,這個簡單,計算每個型別的大小,將它們相加就行了,以32為平台為例,int型別佔4字節,char占用1字節,所以:4 + 3 + 4 = 11,那麼這個結構體一共占用11字節空間。好吧,那麼我們就用實踐來證明是否正確,我們用sizeof運算子來求出這個結構體占用記憶體空間大小,sizeof(memalign),出乎意料的是,結果居然為12?看來我們錯了?當然不是,而是這個結構體被優化了,這個優化有個另外乙個名字叫「對齊」,那麼這個對齊到底做了什麼樣的優化呢,聽我慢慢解釋,再解釋之前我們先看乙個圖,圖如下:
相信學過彙編的朋友都很熟悉這張圖,這張圖就是cpu與記憶體如何進行資料交換的模型,其中,左邊藍色的方框是cpu,右邊綠色的方框是記憶體,記憶體上面的0~3是記憶體位址。這裡我們這張圖是以32位cpu作為代表,我們都知道,32位cpu是以雙字(dword)為單位進行資料傳輸的,也正因為這點,造成了另外乙個問題,那麼這個問題是什麼呢?這個問題就是,既然32位cpu以雙字進行資料傳輸,那麼,如果我們的資料只有8位或16位資料的時候,是不是cpu就按照我們資料的位數來進行資料傳輸呢?其答案是否定的,如果這樣會使得cpu硬體變的更複雜,所以32位cpu傳輸資料無論是8位或16位都是以雙字進行資料傳輸。那麼也罷,8位或16位一樣可以傳輸,但是,事情並非像我們想象的那麼簡單,比如,乙個int型別4字節的資料如果放在上圖記憶體位址1開始的位置,那麼這個資料占用的記憶體位址為1~4,那麼這個資料就被分為了2個部分,乙個部分在位址0~3中,另外一部分在位址4~7中,又由於32位cpu以雙字進行傳輸,所以,cpu會分2次進行讀取,一次先讀取位址0~3中內容,再一次讀取位址4~7中資料,最後cpu提取並組合出正確的int型別資料,捨棄掉無關資料。那麼反過來,如果我們把這個int型別4字節的資料放在上圖從位址0開始的位置會怎樣呢?讀到這裡,也許你明白了,cpu只要進行一次讀取就可以得到這個int型別資料了。沒錯,就是這樣,這次cpu只用了乙個週期就得到了資料,由此可見,對記憶體資料的擺放是多麼重要啊,擺放正確位置可以減少cpu的使用資源。
那麼,記憶體對齊有哪些原則呢?我總結了一下大致分為三條:
第一條:第乙個成員的首位址為0
第二條補充:以4位元組對齊為例,如果自身大小大於4字節,都以4字節整數倍為基準對齊。
第三條:最後以結構總體對齊。
第三條補充:以4字節對齊為例,取結構體中最大成員型別倍數,如果超過4字節,都以4字節整數倍為基準對齊。(其中這一條還有個名字叫:「補齊」,補齊的目的就是多個結構變數挨著擺放的時候也滿足對齊的要求。)
上述的三原則聽起來還是比較抽象,那麼接下來我們通過乙個例子來加深對記憶體對齊概念的理解,下面是乙個結構體,我們動手算出下面結構體一共占用多少記憶體?假設我們以32位平台並且以4字節對齊方式:
#pragma pack(4)
typedef struct memalign
memalign;
下圖為對齊後結構如下:
我們就以這個圖來講解是如何對齊的:
第乙個成員(char a[18]):首先,假設我們把它放到記憶體開始位址為0的位置,由於第乙個成員佔18個字節,所以第乙個成員占用記憶體位址範圍為0~18。
第二個成員(double b):由於double型別佔8字節,又因為8字節大於4字節,所以就以4字節對齊為基準。由於第乙個成員結束位址為18,那麼位址18並不是4的整數倍,我們需要再加2個字節,也就是從位址20開始擺放第二個成員。
第三個成員(char c):由於char型別佔1字節,任意位址是1字節的整數倍,所以我們就直接將其擺放到緊接第二個成員之後即可。
第四個成員(int d):由於int型別佔4字節,但是位址29並不是4的整數倍,所以我們需要再加3個字節,也就是從位址32開始擺放這個成員。
第五個成員(short e):由於short型別佔2字節,位址36正好是2的整數倍,這樣我們就可以直接擺放,無需填充字節,緊跟其後即可。
這樣我們記憶體對齊就完成了。但是離成功還差那麼一步,那是什麼呢?對,是對整個結構體補齊,接下來我們就補齊整個結構體。那麼,先讓我們回顧一下補齊的原則:「以4字節對齊為例,取結構體中最大成員型別倍數,如果超過4字節,都以4字節整數倍為基準對齊。」在這個結構體中最大型別為double型別(佔8字節),又由於8字節大於4字節,所以我們還是以4字節補齊為基準,整個結構體結束位址為38,而位址38並不是4的整數倍,所以我們還需要加額外2個字節來填充結構體,如下圖紅色的就是補齊出來的空間:
到此為止,我們記憶體對齊與補齊就完畢了!接下來我們用實驗來證明真理,程式如下:
#include #include // 由於vs2010預設是8字節對齊,我們
// 通過預編譯來通知編譯器我們以4字節對齊
#pragma pack(4)
// 用於測試的結構體
typedef struct memalign
memalign;
int main()
程式執行過程中,檢視記憶體如下:
其中,各種顏色帶下劃線的代表各個成員變數,藍色方框的代表為記憶體對齊時候填補的多餘字節,由於這裡看不到補齊效果,我們接下來看下圖,下圖籃框包圍的字節就是與上圖的交集以外的部分就是補齊所填充的字節。
在最後,我在談一談關於補齊的作用,補齊其實就是為了讓這個結構體定義的陣列變數時候,陣列內部,也同樣滿足記憶體對齊的要求,為了更好的理解這點,我做了乙個跟本例子相對照的圖:
吃虧在四位元組對齊
吃虧在四位元組對齊 我在寫程式的時候遇到乙個問題,費了我半天的時間才找到答案,記錄如下 我原來乙個程式有如下結構 uchar rx buf max buf typedef struct 本結構體保證四位元組對齊 protocol 程式片斷 protocol proto for i 0 itx buf...
位元組對齊 8位元組對齊
參考博文 參考1 參考2 參考3 在記憶體管理中經常使用位元組對齊來管理分配的記憶體。1 原理 2 演算法 2.1unsigned intcalc align unsigned int n,unsigned align 2.2 更好的演算法 unsigned intcalc align unsign...
python 過濾四位元組字元 表情字元
專案中有時需要過濾掉四位元組以上的字元 表情 比如mysql資料庫5.5.3以下的版本text欄位不支援四位元組以上字元 於是就需要過濾掉再入庫,python中的方法為 try python ucs 4 build的處理方式 highpoints re.compile u u00010000 u00...