水滴石穿C語言之指標綜合談

joel spolsky認為，對指標的理解是一種aptitude，不是通過訓練就可以達到的。雖然如此，我還是想談一談這個c/c++語言中最強勁也是最容易出錯的要素。

鑑於指標和目前計算機記憶體結構的關聯，很多c語言比較本質的特點都孕育在其中，因此，本篇和第

六、第七兩篇我都將以指標為主線，結合在實際程式設計中遇到的問題，來詳細談談關於指標的幾個重要方面。

指標型別的本質分析

1、指標的本質

指標的本質：一種復合的資料型別。下面我將以下面幾個作為例子進行展開分析：

a)、int *p;

b)、int **p;

c)、int (*parvalue)[3];

d)、int (*pfun)();

分析：所謂的資料型別就是具有某種資料特徵的東東，比如資料型別char，它的資料特徵就是它所佔據的記憶體為1個位元組, 指標也很類似，指標所指向的值也佔據著記憶體中的一塊位址，位址的長度與指標的型別有關，比如對於char型指標，這個指標佔據的記憶體就是1個位元組，因此指標也是一種資料型別，但我們知道指標本身也佔據了乙個記憶體空間位址，位址的長度和機器的字長有關，比如在32位機器中，這個長度就是4個位元組，因此指標本身也同樣是一種資料型別，因此，我們說，指標其實是一種復合的資料型別，

好了，現在我們可以分析上面的幾個例子了。

假設有如下定義：

int nvalue;

那麼，nvalue的型別就是int，也就是把nvalue這個具體變數去掉後剩餘的部分，因此，上面的4個宣告可以模擬進行分析：

a)、int *

*代表變數（指標本身）的值是乙個位址，int代表這個位址裡面存放的是乙個整數，這兩個結合起來，int *定義了乙個指向整數的指標，類推如下:

b)、int **

指向乙個指向整數的指標的指標。

c)、int (*)[3]

指向乙個擁有三個整數的陣列的指標。

d)、int (*)()

指向乙個函式的指標，這個函式引數為空，返回值為整數。

分析結束，從上面可以看出，指標包括兩個方面，乙個是它本身的值，是乙個記憶體中的位址；另乙個是指標所指向的物，是這個位址中所存放著具有各種各樣意義的資料。

2、對指標本身值的分析

下面例子考察指標本身的值（環境為32位的計算機）：

void *p = malloc( 100 );

請計算sizeof ( p ) = ?

char str = 「hello」 ;

char *p = str ;

請計算sizeof ( p ) = ?

分析：上面的例子，答案都是4，因為從上面的討論可以知道，指標本身的值對應著記憶體中的乙個位址，它的size只與機器的字長有關（即它是由系統的記憶體模型決定的），在32位機器中，這個長度是4個位元組。

3、對指標所指向物的分析

現在再對指標這個復合型別的第二部分，指標所指向物的意義進行分析。

上面我們已經得到了指標本身的型別，那麼將指標本身的型別去掉「*」號就可得到指標所指向物的型別，分別如下：

a)、int

所指向物是乙個整數。

b)、int*

所指向物是乙個指向整數的指標。

c)、int ()[3]

()為空，可以去掉，變為int [3]，所指向物是乙個擁有三個整數的陣列。

d)、int ()()

第乙個()為空，可以去掉，變為int (),所指向物是乙個函式，這個函式的引數為空，返回值為整數。

4、附加分析

另外，關於指標本身大小的問題，在c++中與c有所不同，這裡我也順帶談一下。

在c++中，對於指向物件成員的指標，它的大小不一定是4個位元組，這主要是因為在引入多重虛擬繼承以及虛函式的時候，有些附加的資訊也需要通過這個指標進行傳遞，因此指向物件成員的指標會增大，不論是指向成員資料，還是成員函式都是如此，具體與編譯器的實現有關，你可以編寫個很小的c++程式去驗證一下。另外，對乙個類的靜態成員（static member，可以是靜態成員變數或者靜態成員函式）來說，指向它的指標只是普通的函式指標，而不是乙個指向類成員的指標，所以它的大小不會增加，仍舊是4個位元組。

指標運算子&和*

「&和*」，它們是一對相反的操作，』&』取得乙個物的位址（也就是指標本身），』*』得到乙個位址裡放的物（指標所指向的物）。這個東西可以是值（物件）、函式、陣列、類成員（class member）等等。

參照上面的分析我們可以很好地理解&與*。

使用指標的好處？

關於指標的本質和基本的運算子我們討論過了，在這裡，我想再籠總地談一談使用指標的必要性和好處，為我們今後的使用和對後面篇章的理解做好鋪墊。簡而言之，指標有以下好處：

1)、方便使用動態分配的陣列。

這個解釋我放在本系列第六篇中進行講解。

2)、對於相同型別（甚至是相似型別）的多個變數進行通用訪問。

就是用乙個指標變數不斷在多個變數之間指來指去，從而使得非常應用起來非常靈活，不過，這招也比較危險，需要小心使用：因為出現錯誤的指標是程式設計中非常忌諱的事情。

3)、變相改變乙個函式的值傳遞特性。

說白了，就是指標的傳位址作用，將乙個變數的位址作為引數傳給函式，這樣函式就可以修改那個變數了。

4)、節省函式呼叫代價。

我們可以將引數，尤其是大個的引數（例如結構，物件等），將他們位址作為引數傳給函式，這樣可以省去編譯器為它們製作副本所帶來的空間和時間上的開銷。

5)、動態擴充套件資料結構。

因為指標可以動態地使用malloc/new生成堆上的記憶體，所以在需要動態擴充套件資料結構的時候，非常有用；比如對於樹、鍊錶、hash表等，這幾乎是必不可少的特性。

6)、與目前計算機的記憶體模型相對應，可按照記憶體位址進行直接訪問，這使得c非常適合於一些較底層的應用。

這也是c/c++指標乙個強大的優點，我會在後面講述c語言的底層操作時，較詳細地介紹這個優點的應用。

7)、遍歷陣列。

據個例子來說吧，當你需要對字串陣列進行操作時，想一想，你當然要用字串指標在字串上掃來掃去。

…實在太多了，你可以慢慢來補充^_^。

指標本身的相關問題

1、問題：空指標的定義

曾經看過有的.h檔案將null定義為0l，為什麼？

答案與分析：

這是乙個關於空指標巨集定義的問題。指標在c語言中是經常使用的，有時需要將乙個指標置為空指標，例如在指標變數初始化的時候。

c語言中的空指標和pascal或者lisp語言中的nil具有相同的地位。那如何定義空指標呢？下面的語句是正確的：

char *p1 = 0;

int *p2;

if (p != 0)

p2 = 0;

也就是說，在指標變數的初始化、賦值、比較操作中，0會被編譯器理解為要將指標置為空指標。至於空指標的內部表示是否是0，則隨不同的機器型別而定，不過通常都是0。但是在另外一些場合下，例如函式的引數原型是指標型別，函式呼叫時如果將0作為引數傳入，編譯器則不能將其理解為空指標。此時需要明確的型別轉換，例如：

void func (char *p);

func ((char *)0);

一般情況下，0是可以放在**中和指標關聯使用的，但是有些程式設計師（數量還不少呦！也許就包括你在內）不喜歡0的直白，認為其不能表示作為指標的特殊含義，於是要定義乙個巨集null，來明確表示空指標常量。這也是對的，人家c語言標準就明確說：「 null應該被定義為與實現相關的空指標常量」。但是將null定義成什麼樣的值呢？我想你一定見過好幾種定義null的方法：

#define null 0

#define null (char *)0

#define null (void *)0

在我們使用的絕大多數計算系統上，例如pc，上述定義是能夠工作的。然而，世界上還有很多其它種類的計算機，其cpu也不是intel的。在某些系統上，指標和整數的大小和內部表示並不一致，甚至不同型別的指標的大小都不一致。為了避免這種可移植性問題，0l是一種最為安全的、最妥帖的定義方式。0l的含義是：「值為0的整數常量表示式」。這與c語言給出的空指標定義完全一致。因此，建議採用0l作為空指標常量null的值。

其實 null定義值，和作業系統的的平台有關，將乙個指標定義為 null，其用意是為了保護作業系統，因為通過指標可以訪問任何一塊位址，但是，有些資料是不許一般使用者訪問的，比如作業系統的核心資料。當我們通過乙個空(null)的指標去方位資料時，系統會提示非法，那麼系統又是如何知道的呢？？

以windows2000系統為例，該系統規定系統中每個程序的起始位址（0x00000000）開始的某個位址範圍內是存放系統資料的，使用者程序無法訪問，所以當使用者用空指標（0）訪問時，其實訪問的就是0x00000000位址的系統資料，由於該位址資料是受系統保護的，所以系統會提示錯誤(指標訪問非法)。

這也就是說null值不一定要定義成0，起始只要定義在系統的保護範圍的位址空間內，比如定義成(0x00000001, 0x00000002)都會起到相同的作用，但是為了考慮到移植性，普遍定義為0 。

2、問題：與指標相關的程式設計規則&規則分析

指標既然這麼重要，而且容易出錯，那麼有沒有方法可以很好地減少這些指標相關問題的出現呢？

答案與分析：

減少出錯的根本是徹底理解指標。

在方法上，遵循一定的編碼規則可能是最立竿見影的方法了，下面我來闡述一下與指標相關的程式設計規則：

1) 未使用的指標初始化為null 。

2) 在給指標分配空間前、分配後均應作判斷。

3) 指標所指向的內容刪除後也要清除指標本身。

要牢記指標是乙個復合的資料結構這個本質，所以我們不論初始化和清除都要同時兼顧指標本身（上述規則1，3）和指標所指向的內容（上述規則2，3）這兩個方面。

遵循這些規則可以有效地減少指標出錯，我們來看下面的例子：

void test(void)}

請問執行test函式會有什麼樣的結果？

答：篡改動態記憶體區的內容，後果難以預料，非常危險。因為free(str);之後，str成為野指標，if(str != null)語句不起作用。

如果我們牢記規則3，在free(str)後增加語句：

str = null;

那麼，就可以防止這樣的錯誤發生

水滴石穿C語言之指標綜合談

水滴石穿C語言之指標綜合談

水滴石穿C語言之指標綜合談

水滴石穿C語言之指標綜合談

相關推薦