蔣麗苑,C語言位域(位段)詳解

2021-10-14 15:33:34 字數 2965 閱讀 2040

在結構體定義時,我們可以指定某個成員變數所占用的二進位制位數(bit),這就是位域。請看下面的例子:

struct bs;

:後面的數字用來限定成員變數占用的位數。成員 m 沒有限制,根據資料型別即可推算出它占用 4 個位元組(byte)的記憶體。成員 n、ch 被:後面的數字限制,不能再根據資料型別計算長度,它們分別占用 4、6 位(bit)的記憶體。

n、ch 的取值範圍非常有限,資料稍微大些就會發生溢位,請看下面的例子:

#include

int main() a = ;

//第一次輸出

printf("%#x, %#x, %c\n", a.m, a.n, a.ch);

//更改值後再次輸出

a.m = 0xb8901c;

a.n = 0x2d;

a.ch = 『z』;

printf("%#x, %#x, %c\n", a.m, a.n, a.ch);

return 0;

}執行結果:

0xad, 0xe, $

0xb8901c, 0xd, :

對於 n 和 ch,第一次輸出的資料是完整的,第二次輸出的資料是殘缺的。

第一次輸出時,n、ch 的值分別是 0xe、0x24(』$』 對應的 ascii 碼為 0x24),換算成二進位制是 1110、10 0100,都沒有超出限定的位數,能夠正常輸出。

第二次輸出時,n、ch 的值變為 0x2d、0x7a(『z』 對應的 ascii 碼為 0x7a),換算成二進位制分別是 10 1101、111 1010,都超出了限定的位數。超出部分被直接截去,剩下 1101、11 1010,換算成十六進製制為 0xd、0x3a(0x3a 對應的字元是 :)。

c語言標準規定,位域的寬度不能超過它所依附的資料型別的長度。通俗地講,成員變數都是有型別的,這個型別限制了成員變數的最大長度,:後面的數字不能超過這個長度。

例如上面的 bs,n 的型別是 unsigned int,長度為 4 個位元組,共計 32 位,那麼 n 後面的數字就不能超過 32;ch 的型別是 unsigned char,長度為 1 個位元組,共計 8 位,那麼 ch 後面的數字就不能超過 8。

我們可以這樣認為,位域技術就是在成員變數所占用的記憶體中選出一部分位寬來儲存資料。

c語言標準還規定,只有有限的幾種資料型別可以用於位域。在 ansi c 中,這幾種資料型別是 int、signed int 和 unsigned int(int 預設就是 signed int);到了 c99,_bool 也被支援了。

關於c語言標準以及 ansi c 和 c99 的區別,我們已在付費教程《c語言的三套標準:c89、c99和c11》中進行了講解。

但編譯器在具體實現時都進行了擴充套件,額外支援了 char、signed char、unsigned char 以及 enum 型別,所以上面的**雖然不符合c語言標準,但它依然能夠被編譯器支援。

位域的儲存

c語言標準並沒有規定位域的具體儲存方式,不同的編譯器有不同的實現,但它們都盡量壓縮儲存空間。

位域的具體儲存規則如下:

當相鄰成員的型別相同時,如果它們的位寬之和小於型別的 sizeof 大小,那麼後面的成員緊鄰前乙個成員儲存,直到不能容納為止;如果它們的位寬之和大於型別的 sizeof 大小,那麼後面的成員將從新的儲存單元開始,其偏移量為型別大小的整數倍。

以下面的位域 bs 為例:

#include

int main();

printf("%d\n", sizeof(struct bs));

return 0;

}執行結果:

4m、n、p 的型別都是 unsigned int,sizeof 的結果為 4 個位元組(byte),也即 32 個位(bit)。m、n、p 的位寬之和為 6+12+4 = 22,小於 32,所以它們會挨著儲存,中間沒有縫隙。

sizeof(struct bs) 的大小之所以為 4,而不是 3,是因為要將記憶體對齊到 4 個位元組,以便提高訪問效率,這將在《c語言記憶體精講》專題的《c語言記憶體對齊,提高定址效率》一節中詳細講解。

如果將成員 m 的位寬改為 22,那麼輸出結果將會是 8,因為 22+12 = 34,大於 32,n 會從新的位置開始儲存,相對 m 的偏移量是 sizeof(unsigned int),也即 4 個位元組。

如果再將成員 p 的位寬也改為 22,那麼輸出結果將會是 12,三個成員都不會挨著儲存。

當相鄰成員的型別不同時,不同的編譯器有不同的實現方案,gcc 會壓縮儲存,而 vc/vs 不會。

請看下面的位域 bs:

#include

int main();

printf("%d\n", sizeof(struct bs));

return 0;

}在 gcc 下的執行結果為 4,三個成員挨著儲存;在 vc/vs 下的執行結果為 12,三個成員按照各自的型別儲存(與不指定位寬時的儲存方式相同)。

m 、ch、p 的長度分別是 4、1、4 個位元組,共計占用 9 個位元組記憶體,為什麼在 vc/vs 下的輸出結果卻是 12 呢?這個疑問將在《c語言和記憶體》專題的《c語言記憶體對齊,提高定址效率》一節中為您解開。

3) 如果成員之間穿插著非位域成員,那麼不會進行壓縮。例如對於下面的 bs:

純文字複製

struct bs;

在各個編譯器下 sizeof 的結果都是 12。

通過上面的分析,我們發現位域成員往往不占用完整的位元組,有時候也不處於位元組的開頭位置,因此使用&獲取位域成員的位址是沒有意義的,c語言也禁止這樣做。位址是位元組(byte)的編號,而不是位(bit)的編號。

無名位域

位域成員可以沒有名稱,只給出資料型別和位寬,如下所示:

純文字複製

struct bs;

無名位域一般用來作填充或者調整成員位置。因為沒有名稱,無名位域不能使用。

上面的例子中,如果沒有位寬為 20 的無名成員,m、n 將會挨著儲存,sizeof(struct bs) 的結果為 4;有了這 20 位作為填充,m、n 將分開儲存,sizeof(struct bs) 的結果為 8。

C語言位域(位段)詳解

有些資料在儲存時並不需要占用乙個完整的位元組,只需要占用乙個或幾個二進位制位即可。例如開關只有通電和斷電兩種狀態,用 0 和 1 表示足以,也就是用乙個二進位。正是基於這種考慮,c語言又提供了一種叫做位域的資料結構。在結構體定義時,我們可以指定某個成員變數所占用的二進位制位數 bit 這就是位域。請...

C語言位域 位段

有些資訊在儲存時,並不需要占用乙個完整的位元組,而只需佔幾個或乙個二進位制位。例如開關只有通電和斷電兩種狀態,用0和1表示足以,也就是用乙個二進位。所以c語言又提供了一種資料結構,稱為位域或 位段。位域在應用開發中較少使用,你可以暫時跳過,遇到相關問題再回來溫習。所謂 位域 是把乙個位元組中的二進位...

C語言位域 位段

有些資訊在儲存時,並不需要占用乙個完整的位元組,而只需佔幾個或乙個二進位制位。例如開關只有通電和斷電兩種狀態,用0和1表示足以,也就是用乙個二進位。所以c語言又提供了一種資料結構,稱為位域或位段。位域在應用開發中較少使用,你可以暫時跳過,遇到相關問題再回來溫習。所謂 位域 是把乙個位元組中的二進位劃...