c++ 虛函式表解析
c++中的虛函式的作用主要是實現了多型的機制。關於多型,簡而言之就是用父型別別的指標指向其子類的例項,然後通過父類的指標呼叫實際子類的成員函式。這種技術可以讓父類的指標有「多種形態」,這是一種泛型技術。所謂泛型技術,說白了就是試圖使用不變的**來實現可變的演算法。比如:模板技術,rtti技術,虛函式技術,要麼是試圖做到在編譯時決議,要麼試圖做到執行時決議。
當然,相同的文章在網上也出現過一些了,但我總感覺這些文章不是很容易閱讀,大段大段的**,沒有,沒有詳細的說明,沒有比較,沒有舉一反三。不利於學習和閱讀,所以這是我想寫下這篇文章的原因。也希望大家多給我提意見。
言歸正傳,讓我們一起進入虛函式的世界。
虛函式表
對c++ 了解的人都應該知道虛函式(virtual function)是通過一張虛函式表(virtual table)來實現的。簡稱為v-table。在這個表中,主是要乙個類的虛函式的位址表,這張表解決了繼承、覆蓋的問題,保證其容真實反應實際的函式。這樣,在有虛函式的類的例項中這個表被分配在了這個例項的記憶體中,所以,當我們用父類的指標來操作乙個子類的時候,這張虛函式表就顯得由為重要了,它就像乙個地圖一樣,指明了實際所應該呼叫的函式。
這裡我們著重看一下這張虛函式表。c++的編譯器應該是保證虛函式表的指標存在於物件例項中最前面的位置(這是為了保證取到虛函式表的有最高的效能——如果有多層繼承或是多重繼承的情況下)。 這意味著我們通過物件例項的位址得到這張虛函式表,然後就可以遍歷其中函式指標,並呼叫相應的函式。
聽我扯了那麼多,我可以感覺出來你現在可能比以前更加暈頭轉向了。 沒關係,下面就是實際的例子,相信聰明的你一看就明白了。
假設我們有這樣的乙個類:
class base
virtual void g()
virtual void h() };
按照上面的說法,我們可以通過base的例項來得到虛函式表。 下面是實際例程:
typedef void(*fun)(void);
base b;
fun pfun = null;
// invoke the first virtual function
pfun = (fun)*((int*)*(int*)(&b));
pfun();
實際執行經果如下:(windows xp+vs2003, linux 2.6.22 + gcc 4.1.3)
base::f
通過這個示例,我們可以看到,我們可以通過強行把&b轉成int *,取得虛函式表的位址,然後,再次取址就可以得到第乙個虛函式的位址了,也就是base::f(),這在上面的程式中得到了驗證(把int* 強制轉成了函式指標)。通過這個示例,我們就可以知道如果要呼叫base::g()和base::h(),其**如下:
(fun)*((int*)*(int*)(&b)+0); // base::f()
(fun)*((int*)*(int*)(&b)+1); // base::g()
(fun)*((int*)*(int*)(&b)+2); // base::h()
這個時候你應該懂了吧。什麼?還是有點暈。也是,這樣的**看著太亂了。沒問題,讓我畫個**釋一下。如下所示:
注意:在上面這個圖中,我在虛函式表的最後多加了乙個結點,這是虛函式表的結束結點,就像字串的結束符「/0」一樣,其標誌了虛函式表的結束。這個結束標誌的值在不同的編譯器下是不同的。在winxp+vs2003下,這個值是null。而在ubuntu 7.10 + linux 2.6.22 + gcc 4.1.3下,這個值是如果1,表示還有下乙個虛函式表,如果值是0,表示是最後乙個虛函式表。
下面,我將分別說明「無覆蓋」和「有覆蓋」時的虛函式表的樣子。沒有覆蓋父類的虛函式是毫無意義的。我之所以要講述沒有覆蓋的情況,主要目的是為了給乙個對比。在比較之下,我們可以更加清楚地知道其內部的具體實現。
一般繼承(無虛函式覆蓋)
下面,再讓我們來看看繼承時的虛函式表是什麼樣的。假設有如下所示的乙個繼承關係:
請注意,在這個繼承關係中,子類沒有過載任何父類的函式。那麼,在派生類的例項中,其虛函式表如下所示:
對於例項:derive d; 的虛函式表如下:
我們可以看到下面幾點:
1)虛函式按照其宣告順序放於表中。
2)父類的虛函式在子類的虛函式前面。
我相信聰明的你一定可以參考前面的那個程式,來編寫一段程式來驗證。
一般繼承(有虛函式覆蓋)
覆蓋父類的虛函式是很顯然的事情,不然,虛函式就變得毫無意義。下面,我們來看一下,如果子類中有虛函式過載了父類的虛函式,會是乙個什麼樣子?假設,我們有下面這樣的乙個繼承關係。
我們從表中可以看到下面幾點,
1)覆蓋的f()函式被放到了虛表中原來父類虛函式的位置。
2)沒有被覆蓋的函式依舊。
這樣,我們就可以看到對於下面這樣的程式,
base *b = new derive();
b->f();
由b所指的記憶體中的虛函式表的f()的位置已經被derive::f()函式位址所取代,於是在實際呼叫發生時,是derive::f()被呼叫了。這就實現了多型。
多重繼承(無虛函式覆蓋)
下面,再讓我們來看看多重繼承中的情況,假設有下面這樣乙個類的繼承關係。注意:子類並沒有覆蓋父類的函式。
對於子類例項中的虛函式表,是下面這個樣子:
我們可以看到:
1) 每個父類都有自己的虛表。
2) 子類的成員函式被放到了第乙個父類的表中。(所謂的第乙個父類是按照宣告順序來判斷的)
這樣做就是為了解決不同的父類型別的指標指向同乙個子類例項,而能夠呼叫到實際的函式。
多重繼承(有虛函式覆蓋)
下面我們再來看看,如果發生虛函式覆蓋的情況。
下圖中,我們在子類中覆蓋了父類的f()函式。
下面是對於子類例項中的虛函式表的圖:
我們可以看見,三個父類虛函式表中的f()的位置被替換成了子類的函式指標。這樣,我們就可以任一靜態型別的父類來指向子類,並呼叫子類的f()了。如:
derive d;
base1 *b1 = &d;
base2 *b2 = &d;
base3 *b3 = &d;
b1->f(); //derive::f()
b2->f(); //derive::f()
b3->f(); //derive::f()
b1->g(); //base1::g()
b2->g(); //base2::g()
b3->g(); //base3::g()
安全性
每次寫c++的文章,總免不了要批判一下c++。這篇文章也不例外。通過上面的講述,相信我們對虛函式表有乙個比較細緻的了解了。水可載舟,亦可覆舟。下面,讓我們來看看我們可以用虛函式表來幹點什麼壞事吧。
一、通過父型別的指標訪問子類自己的虛函式
我們知道,子類沒有過載父類的虛函式是一件毫無意義的事情。因為多型也是要基於函式過載的。雖然在上面的圖中我們可以看到base1的虛表中有derive的虛函式,但我們根本不可能使用下面的語句來呼叫子類的自有虛函式:
base1 *b1 = new derive();
b1->f1(); //編譯出錯
任何妄圖使用父類指標想呼叫子類中的未覆蓋父類的成員函式的行為都會被編譯器視為非法,所以,這樣的程式根本無法編譯通過。但在執行時,我們可以通過指標的方式訪問虛函式表來達到違反c++語義的行為。(關於這方面的嘗試,通過閱讀後面附錄的**,相信你可以做到這一點)
二、訪問non-public的虛函式
另外,如果父類的虛函式是private或是protected的,但這些非public的虛函式同樣會存在於虛函式表中,所以,我們同樣可以使用訪問虛函式表的方式來訪問這些non-public的虛函式,這是很容易做到的。 如:
class base };
class derive : public base;
typedef void(*fun)(void);
void main()
附錄 二:例程
下面是乙個關於多重繼承的虛函式表訪問的例程:
#include using namespace std;
class base1
virtual void g()
virtual void h() };
class base2
virtual void g()
virtual void h() };
class base3
virtual void g()
virtual void h() };
class derive : public base1, public base2, public base3
virtual void g1() };
typedef void(*fun)(void);
int main()
C 虛函式表解析
前言 c 中的虛函式的作用主要是實現了多型的機制。關於多型,簡而言之就是用父型別別的指標指向其子類的例項,然後通過父類的指標呼叫實際子類的成員函式。這種技術可以讓父類的指標有 多種形態 這是一種泛型技術。所謂泛型技術,說白了就是試圖使用不變的 來實現可變的演算法。比如 模板技術,rtti技術,虛函式...
C 虛函式表解析
c 中的虛函式的作用主要是實現了多型的機制。關於多型,簡而言之就是用父型別別的指標指向其子類的例項,然後通過父類的指標呼叫實際子類的成員函式。這種技術可以讓父類的指標有 多種形態 這是一種泛型技術。所謂泛型技術,說白了就是試圖使用不變的 來實現可變的演算法。比如 模板技術,rtti技術,虛函式技術,...
C 虛函式表解析
今天我做的筆記 c 中的虛函式的作用主要是實現了多型的機制。關於多型,簡而言之就是用父型別別的指標指向其子類的例項,然後通過父類的指標呼叫實際子類的成員函式。這種技術可以讓父類的指標有 多種形態 這是一種泛型技術。所謂泛型技術,說白了就是試圖使用不變的 來實現可變的演算法。比如 模板技術,rtti技...