由c語言**(文字檔案)形成可執行程式(二進位制檔案),需要經過編譯-彙編-連線三個階段。編譯過程把c語言文字檔案生成匯程式設計序,彙編過程把匯程式設計序形成二進位制機器**,連線過程則將各個原始檔生成的二進位制機器**檔案組合成乙個檔案。
c語言編寫的程式經過編譯-連線後,將形成乙個統一檔案,它由幾個部分組成。在程式執行時又會產生其他幾個部分,各個部分代表了不同的儲存區域:
1.**段(code或text)
**段由程式中執行的機器**組成。在c語言中,程式語句進行編譯後,形成機器**。在執行程式的過程中,cpu的程式計數器指向**段的每一條機器**,並由處理器依次執行。
2.唯讀資料段(ro data)
唯讀資料段是程式使用的一些不會被更改的資料,使用這些資料的方式類似查表式的操作,由於這些變數不需要更改,因此只需要放置在唯讀儲存器中即可。
3.已初始化讀寫資料段(rw data)
已初始化資料是在程式中宣告,並且具有初值的變數,這些變數需要占用儲存器的空間,在程式執行時它們需要位於可讀寫的記憶體區域內,並具有初值,以供程式執行時讀寫。
4.未初始化資料段(bss)
未初始化資料是在程式中宣告,但是沒有初始化的變數,這些變數在程式執行之前不需要占用儲存器的空間。
5.堆(heap)
堆記憶體只在程式執行時出現,一般由程式設計師分配和釋放。在具有作業系統的情況下,如果程式沒有釋放,作業系統可能在程式(例如乙個程序)結束後**記憶體。
6.棧(stack)
棧記憶體只在程式執行時出現,在函式內部使用的變數、函式的引數以及返回值將使用棧空間,棧空間由編譯器自動分配和釋放。
c語言目標檔案的記憶體布局
看乙個例子:
int a = 0; //全域性初始化區,。data段
static
int b=20; //全域性初始化區,。data段
char *p1; //全域性未初始化區 .bss段
const
int a = 10; //.rodata段
void main(void)
**段、唯讀資料段、讀寫資料段、未初始化資料段屬於靜態區域,而堆和棧屬於動態區域。**段、唯讀資料段和讀寫資料段將在鏈結之後產生,未初始化資料段將在程式初始化的時候開闢,而堆和棧將在程式的執行中分配和釋放。c語言程式分為映像和執行時兩種狀態。在編譯-連線後形成的映像中,將只包含**段(text)、唯讀資料段(ro data)和讀寫資料段(rw data)。在程式執行之前,將動態生成未初始化資料段(bss),在程式的執行時還將動態形成堆(heap)區域和棧(stack)區域。一般來說,在靜態的映像檔案中,各個部分稱之為節(section),而在執行時的各個部分稱之為段(segment)。如果不詳細區分,可以統稱為段。
知識點:
c語言在編譯和連線後,將生成**段(text)、唯讀資料段(ro data)和讀寫資料段(rw data)。在執行時,除了以上三個區域外,還包括未初始化資料段(bss)區域和堆(heap)區域和棧(stack)區域。
1.**段(code或text)
**段由各個函式產生,函式的每乙個語句將最終經過編繹和彙編生成二進位制機器**(具體生生哪種體系結構的機器**由編譯器決定)。
2.唯讀資料段(ro data)
唯讀資料段由程式中所使用的資料產生,該部分資料的特點是在執行中不需要改變,因此編譯器會將該資料段放入唯讀的部分中。c語言中的唯讀全域性變數,唯讀區域性變數,程式中使用的常量等會在編譯時被放入到唯讀資料區。
注意:定義全域性變數const char a[100]=;將生成大小為100個位元組的唯讀資料區,並使用「abcdefg」初始化。如果定義為:const char a[ ]=;則根據字串長度生成8個位元組的唯讀資料段(還有』\0』),所以在唯讀資料段中,一般都需要做完全的初始化。
3.讀寫資料段(rw data)
讀寫資料段表示了在目標檔案中一部分可以讀也可以寫的資料區,在某些場合它們又被稱為已初始化資料段,這部分資料段和**段,與唯讀資料段一樣都屬於程式中的靜態區域,但具有可寫性的特點。通常已初始化的全域性變數和區域性靜態變數被放在了讀寫資料段,如: 在函式中定義static char b[ 100]=;讀寫資料區的特點是必須在程式經過初始化,如果只定義,沒初始值,則不會生成讀寫資料區,而會定位為未初始化資料區(bss)。如果全域性變數(函式外部定義的變數)加入static修飾,這表示只能在檔案內使用,而不能被其他檔案使用。
4. 未初始化資料段(bss)
與讀寫資料段類似,它也屬於靜態資料區,但是該段中的資料沒有經過初始化。因此它只會在目標檔案中被標識,而不會真正稱為目標檔案中的一段,該段將會在執行時產生。未初始化資料段只在執行的初始化階段才會產生,因此它的大小不會影響目標檔案的大小。
在c語言的程式中,對變數的使用還有以下幾點需要注意:
1.函式體中定義的變數通常是在棧上,不需要在程式中進行管理,由編繹器處理。
2.用malloc,calloc,realloc等分配記憶體的函式所分配的記憶體空間在堆上,程式必須保證在使用free釋放,否則會發生記憶體洩漏。
3.所有函式體外定義的是全域性變數,加了static後的變數不管是在函式內部或外部都放在全域性區。
4.使用const定義的變數將放於程式的唯讀資料區。
下面用乙個簡單的例子來說明c語言中變數和段的對應關係。c語言程式中的全域性區(靜態區),實際對應著下述幾個段:ro data; rw data ; bss data.
一般來說,直接定義的全域性變數在未初始化資料區,如果該變數有初始化則是在已初始化資料區(rw data),加上const則將放在唯讀資料區。
const
char ro[ ] = ; //唯讀資料區
static
char rw_1[ ] =; //已初始化讀寫資料段
char bss_1[ 100]; //未初始化資料段
const
char *ptrconst ="constant data"; //字串放在只讀取資料段
int main()
;//區域性已初始化讀寫資料段
static
char bss_2[100]; //區域性未初始化資料段
static
int c = 0; //全域性(靜態)初始化區
p1=(char *)malloc(10 * sizeof(char ) ); //分配記憶體區域在堆區
strcpy(p1,"***x"); //「***x」放在唯讀資料區,佔5個位元組
free(p1); //使用free釋放p1所指向的記憶體
return
0;}
讀寫資料段包含了初始化的全域性變數 static char rw_1[ ]以及區域性靜態變數static rw_2[ ].其差別在於編繹時,是在函式內部使用的還是可以在整個檔案中使用。對於rw_1 無論有無static 修飾,其都將被放置在讀寫資料區,只是能否被其它檔案引用與否。對於後者就不一樣了,它是區域性靜態變數,放置在讀寫資料區,如果沒static修飾,其意義完全改變,它將會是開闢在棧空間的區域性變數,而不是靜態變數,在這裡rw_1,rw_2後沒具體數值,表示靜態區大小同後面字串長度決定。
對於未初始化資料區bss_1[100]與bss_2[100],其區別在於前者是全域性變數,在所有檔案中都可以使用;後者是區域性變數,只在函式內部使用。未初始化資料段不設定後面的初始化數值,因此必須使用數值指定區域的大小,編繹器將根據大小設定bss中需要增加的長度。
棧空間主要用於以下3資料的儲存:
1.函式內部的動態變數
2.函式的引數
3.函式的返回值
棧空間是動態開闢與**的。在函式呼叫過程中,如果函式呼叫的層次比較多,所需要的棧空間也逐漸加大,對於引數的傳遞和返回值,如果使用較大的結構體,在使用的棧空間也會比較大。
C語言程式的記憶體布局
c語言程式的記憶體布局 章介紹c語言程式的記憶體布局結構,包括連線過程中目標程式各個段的組成和執行過程中各個段載入的情況。在本章的學習中,讀者應重點關注以下內容 c語言程式在記憶體中各個段的組成 c語言程式連線過程中的特性和常見錯誤 c語言程式的執行方式 13.1 c語言程式的儲存區域 由c語言 文...
C語言程式的記憶體布局
c語言程式的記憶體布局 一 c語言程式的儲存區域 1.段 code or text 段由程式中的機器碼組成。在c語言中,程式語句進行編譯後,形成機器 在執行程式的過程中,cpu的程式計數器指向 段的每一條 並由處理器依次執行。2.唯讀資料段 ro data 唯讀資料段是程式使用的一些不會被更改的資料...
C語言程式設計 程式的記憶體布局
一 c語言程式的儲存區域 由c語言 文字檔案 形成可執行程式 二進位制檔案 需要經過編譯 彙編 連線三個階段。編譯過程把c語言文字檔案生成匯程式設計序,彙編過程把匯程式設計序形成二進位制機器 連線過程則將各個原始檔生成的二進位制機器 檔案組合成乙個檔案。c語言編寫的程式經過編譯 連線後,將形成乙個統...