為何C語言（的函式呼叫）需要堆疊，而組合語言不需要

**：uboot中start.s原始碼中指令級的詳盡解析 green-waste

為何 c 語言（的函式呼叫）需要堆疊，而組合語言卻需要堆疊

之前看了很多關亍uboot的分析，其中就有說要為c語言的執行，準備好堆疊。

而自己在uboot的start.s彙編**中，關於系統初始化，也看到有堆疊指標初始化這個動作。但是，從來只看到有人說系統初始化要初始化堆疊，即正確給堆疊指標sp賦值，但是卻從來沒有看到有人解釋，為何要初始化堆疊。所以，接下來的內容，就是經過一定的**，試圖來解釋一下，為何要初始化堆疊，即：

為何c語言的函式呼叫要用到堆疊，而彙編卻不需要初始化堆疊。

要明白這個問題，首先要了解堆疊的作用。

關於堆疊的作用，要詳細講解的話，要很長的篇幅，所以此處只是做簡略介紹。

總的來說，堆疊的作用就是：儲存現場/上下文，傳遞引數。

4.6.1.儲存現場/上下文

現場，意思就相當於案發現場，總有一些現場的情況，要記錄下來的，否則被別人破壞掉後，你就無法恢復現場了。而此處說的現場，就是指cpu執行的時候，用到了一些暫存器，比如r0,r1等等，對於這些暫存器的值，如果你不儲存而直接跳轉到子函式中去執行，那麼很可能就被破壞了，因為其他函式執行也要用到這些暫存器。因此，在函式呼叫前，應該將這些暫存器等現場，暫時保持起來，等呼叫函式執行完畢返回後，再恢復現場。這樣cpu就可以正確的繼續執行了。在計算機中，你常可以看到上下文這個詞，對應的英文是context。

4.6.1.1. 什麼叫做上下文 context

儲存現場，也叫儲存上下文。

上下文，英文叫做context，就是上面的文章，和下面的文章，即與你此刻，當前cpu執行有關係的內容，即那些你用到暫存器。所以，和上面的現場，是乙個意思。

儲存暫存器的值，一般用的是push指令，將對應的某些暫存器的值，乙個個放到堆疊中，把對應的值壓入到堆疊裡面，即所謂的壓棧。然後待被呼叫的子函式執行完畢的時候，再呼叫pop，把堆疊中的乙個個的值，賦值給對應的那些你剛開始壓棧時用到的暫存器，把對應的值從堆疊中彈出去，即所謂的出棧。

其中儲存的暫存器中，也包括lr的值（因為用bl指令執行跳轉的話，那麼之前的pc的值是存在lr中的），然後在子程式執行完畢的時候，再把堆疊中的lr的值pop出來，賦值給pc，這樣就實現了子函式的正確的返回。

4.6.2.傳遞引數

c語言執行函式呼叫的時候，常常會傳遞給被呼叫的函式一些引數，對於這些c語言級別的引數，被編譯器翻譯成組合語言的時候，就要找個地方存放一下，並且讓被呼叫的函式能夠訪問，否則就沒法實現傳遞引數了。對於找個地方放一下，分兩種情況。

一種情況是，本身傳遞的引數就很少，就可以通過暫存器傳送引數。

因為在前面的儲存現場的動作中，已經儲存好了對應的暫存器的值，那麼此時，這些暫存器就是空閒的，可以供我們使用的了，那就可以放引數，而引數少的情冴下，就足夠存放引數了，比如引數有2個，那麼就用r0和r1存放即可。（關於引數1和引數2，具體哪個放在r0，哪個放在r1，就是和apcs中的「在函式呼叫之間傳遞/返回引數」相關了，apcs中會有詳細的約定。感興趣的自己去研究。）

但是如果引數太多，暫存器不夠用，那麼就得把多餘的引數堆疊中了。即，可以用堆疊來傳遞所有的暫存器放不下的那些多餘的引數。

4.6.3.舉例分析 c 語言函式呼叫是如何使用堆疊的

對於上面的解釋的堆疊的作用顯得有些抽象，此處再用例子來簡單說明一下，就容易明白了：

arm-inux-objdump –d u-boot > dump_u-boot.txt

可以得到dump_u-boot.txt檔案。該檔案就是中，包含了u-boot中的程式的可執行的彙編**，其中我們可以看到c語言的函式的源**，到底對應著那些彙編**。

下面貼出兩個函式的彙編**，

乙個是clock_init，

另乙個是不clock_init在同一c原始檔中的，另外乙個凼數copycode2ram：

33d0091c :

33d0091c: e92d4070 push

33d00920: e1a06000 mov r6, r0

33d00924: e1a05001 mov r5, r1

33d00928: e1a04002 mov r4, r2

33d0092c: ebffffef bl 33d008f0

... ...

33d00984: ebffff14 bl 33d005dc

... ...

33d009a8: e3a00000 mov r0, #0 ; 0x0

33d009ac: e8bd8070 pop

33d009b0 :

33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000

33d009b4: e3a03005 mov r3, #5 ; 0x5

33d009b8: e5823014 str r3, [r2, #20]

... ...

33d009f8: e1a0f00e mov pc, lr

（1）clock_init 部分的**

可以看到該凼數第一行：

33d009b0: e3a02313 movr2, #1275068416 ; 0x4c000000

就沒有我們所期望的push指令，沒有去將一些暫存器的值放到堆疊中。這是因為，我們clock_init返部分的內容，所用到的r2,r3等暫存器，和前面呼叫clock_init之前所用到的暫存器r0，沒有衝突，所以此處可以不用push去儲存返類暫存器的值，不過有個暫存器要注意，那就是r14，即lr，其是在前面呼叫clock_init的時候，用的是bl指令，所以會自動把跳轉時候的pc的值賦值給lr，所以也不需要push指令去將pc的值儲存到堆疊中。而clock_init的**的最後一行:

33d009f8: e1a0f00e movp c, lr

就是我們常見的mov pc, lr，把lr的值，即之前儲存的凼數呼叫時候的pc值，賦值給現在的pc，

這樣就實現了凼數的正確的返回，即返回到了凼數呼叫時候下乙個指令的位置。

這樣cpu就可以繼續執行原先凼數內剩下那部分的**了。

（2）copycode2ram 部分的**

其第一行：

33d0091c: e92d4070 push

就是我們所期望的，用push指令，儲存了r4,r5,r以及lr。

用push去儲存r4,r5,r6，那是因為所謂的儲存現場，以後後續函式返回時候再恢復現場，

而用push去儲存lr，那是因為此凼數裡面，還有其他凼數呼叫：

33d0092c: ebffffef bl 33d008f0

... ...

33d00984: ebffff14 bl 33d005dc

... ...

也用到了bl指令，會改變我們最開始迕入clock_init時候的lr的值，所以我們要用push也暫時儲存起來。

而對應地，copycode2ram的最後一行：

33d009ac: e8bd8070 pop

就是把之前push的值，給pop出來，迓給對應的暫存器，其中最後乙個是將開始push的lr的值，pop出來給賦給pc，因為實現了函式返回。

另外，我們注意到，在copycode2ram的倒數第二行是：

33d009a8: e3a00000 movr0, #0 ; 0x0

是把0賦值給r0暫存器，這個就是我們所謂返回值的傳遞，是通過r0暫存器的。

此處的返回值是0，也對應著c詫言的原始碼中的「return 0」 .

對於使用哪個暫存器來傳遞迒回值：當然你也可以用其他暫時空閒沒有用到的暫存器來傳遞返回值，但是這些處理方式，本身是根據arm的apcs的暫存器的使用的約定而設計的，你最好不要隨便改變使用方式，最好還是按照其約定的來處理，這樣程式更加符合規範。

附：什麼是 apcs

apcs，arm 過程呼叫標準(arm procedure call standard)，提供了緊湊的編寫例程的一種機制，定義的例程可以與其他例程交織在一起。最顯著的一點是對這些例程來自**沒有明確的限制。它們可以編譯自 c、 pascal、也可以是用組合語言寫成的。

apcs 定義了:

>>對暫存器使用的限制。

>>使用棧的慣例。

>>在函式呼叫之間傳遞/返回引數。

>>可以被「回溯」的基於棧的結構的格式，用來提供從失敗點到程式入口的函式(和給予的引數)的列表。

為何C語言（的函式呼叫）需要堆疊，而組合語言不需要

為何C語言（的函式呼叫）需要堆疊

Uboot18之為何C需要堆疊而彙編不需要？

c 函式堆疊呼叫

為何C語言（的函式呼叫）需要堆疊，而組合語言不需要

為何C語言（的函式呼叫）需要堆疊

Uboot18之為何C需要堆疊而彙編不需要？

c 函式堆疊呼叫

相關推薦