本文將介紹列表在 cpython中的實現,因為畢竟cpython 又是 python 最為常用的實現。
python 中的列表非常強大,看看它的內部實現機制是怎麼樣的,一定非常有趣。
下面是一段 python 指令碼,在列表中新增幾個整數,然後列印列表。
python
>>> l =
>>> l
[1, 2, 3]
>>> for e in l:
... print e
可以發現,列表是乙個迭代器。
cpython 中的列表實現類似於下面的 c 結構體。ob_item 是指向列表物件的指標陣列。allocated 是申請記憶體的槽的個數。
python
typedef struct pylistobject;
看看初始化乙個空列表的時候發生了什麼,例如:l = 。
python
arguments: size of the list = 0
returns: list object =
pylistnew:
nbytes = size * size of global python object = 0
allocate new list object
allocate list of pointers (ob_item) of size nbytes = 0
clear ob_item
set list's allocated var to 0 = 0 slots
return list object
要分清列表大小和分配的槽大小,這很重要。列表的大小和 len(l) 的大小相同。分配槽的大小是指已經在記憶體中分配了的槽空間數。通常分配的槽的大小要大於列表大小,這是為了避免每次列表新增元素的時候都呼叫分配記憶體的函式。下面會具體介紹。
python
arguments: list object, new element
returns: 0 if ok, -1 if not
n = size of list
call list_resize() to resize the list to size n+1 = 0 + 1 = 1
list[n] = list[0] = new element
return 0
下面是 list_resize() 函式。它會多申請一些記憶體,避免頻繁呼叫 list_resize() 函式。列表的增長模式為:0,4,8,16,25,35,46,58,72,88……
python
arguments: list object, new size
returns: 0 if ok, -1 if not
list_resize:
new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6) = 3
new_allocated += newsize = 3 + 1 = 4
resize ob_item (list of pointers) to size new_allocated
return 0
現在分配了 4 個用來裝列表元素的槽空間,並且第乙個空間中為整數 1。如下圖顯示 l[0] 指向我們新新增的整數物件。虛線的方框表示已經分配但沒有使用的槽空間。
列表追加元素操作的平均複雜度為 o(1)。
在列表偏移量 1 的位置插入新元素,整數 5:l.insert(1,5),內部呼叫ins1() 函式。
虛線的方框依舊表示已經分配但沒有使用的槽空間。現在分配了 8 個槽空間,但是列表的大小卻只是 5。
列表插入操作的平均複雜度為 o(n)。
取出列表最後乙個元素 即l.pop(),呼叫了 listpop() 函式。在 listpop() 函式中會呼叫 list_resize 函式,如果取出元素後列表的大小小於分配的槽空間數的一半,將會縮減列表的大小。
python
arguments: list object
returns: element popped
listpop:
if list empty:
return null
resize list with size 5 - 1 = 4. 4 is not less than 8/2 so no shrinkage
set list object size to 4
return last element
列表 pop 操作的平均複雜度為 o(1)。
可以看到 pop 操作後槽空間 4 依然指向原先的整數物件,但是最為關鍵的是現在列表的大小已經變為 4。
繼續 pop 乙個元素。在 list_resize() 函式中,size – 1 = 4 – 1 = 3 已經小於所分配的槽空間大小的一半,所以縮減分配的槽空間為 6,同時現在列表的大小為 3。
可以看到槽空間 3 和 4 依然指向原先的整數,但是現在列表的大小已經變為 3。
python 的列表物件有個方法,刪除指定的元素: l.remove(5)。底層呼叫 listremove() 函式。
python
arguments: list object, element to remove
returns none if ok, null if not
listremove:
loop through each list element:
if correct element:
slice list between element's slot and element's slot + 1
return none
return null
為了做列表的切片並且刪除元素,呼叫了 list_ass_slice() 函式,它的實現方法比較有趣。我們在刪除列表位置 1 的元素 5 的時候,低位的偏移量為 1 同時高位的偏移量為 2.
python
arguments: list object, low offset, high offset
returns: 0 if ok
list_ass_slice:
copy integer 5 to recycle list to dereference it
shift elements from slot 2 to slot 1
resize list to 5 slots
return 0
列表 remove 操作的複雜度為 o(n)。
深入 Python 列表的內部實現
本文將介紹列表在 cpython中的實現,因為畢竟cpython 又是 python 最為常用的實現。python 中的列表非常強大,看看它的內部實現機制是怎麼樣的,一定非常有趣。下面是一段 python 指令碼,在列表中新增幾個整數,然後列印列表。可以發現,列表是乙個迭代器。列表物件的 c 語言結...
Python 深入列表
在學習python的列表推導式前,我們先學習三個東西 lambda map filter lambda是在一行中編寫乙個函式,但如果這個函式被多次呼叫,則其效能會受到一定的影響,其格式為 函式名 lambda 引數1,引數2 函式體如 add lambda a1,a2 a1 a2該lambda表示式...
python列表內部元素的訪問
提取列表中的元素之後,放在其他的資料中,對其處理的時候原來的列表資料也會發生改變 提取列表中的元素,放在其他列表中,在新的列表中處理它的時候,原來列表中的元素也會變化,找了比較長時間才發現這個問題。如下列的示例 所示 給定乙個原來的列表 list1 a b c d e f 新建乙個空列表 list2...