字串 Intern 機制

2021-09-11 09:12:19 字數 1624 閱讀 5331

字串在 python 中是最簡單也是最常用的資料型別之一,在 cpython 中字串的實現原理使用了一種叫做 intern(字串駐留)的技術來提高字串效率。究竟什麼是 intern 機制,這種機制又是通過什麼方式來提高字串效率的呢?希望這篇文章能夠拋磚引玉。

先來看一段**:

>>> s3 = "hello!"

>>> s4 = "hello!"

>>> s3 is s4

false

>>> id(s3)

80325968l

>>> id(s4)

80326048l

複製**

s3 和 s4 雖然值是一樣的,但確確實實是兩個不同的字串物件,python 會為它們倆各自分配一段記憶體空間,假設程式中存在大量值相同的字串,系統就不得不為每個字串重複地分配記憶體空間,顯然,對系統來說是一種無謂的資源浪費。為了解決這種問題,python 引入了 intern 機制。

再來看:

>>> s3 = intern('hello!')

>>> s4 = intern('hello!')

>>> s3 is s4

true

>>> id(s3)

80325968l

>>> id(s4)

80325968l

複製**

intern是 python 中的乙個內建函式,該函式的作用就是對字串進行 intern 機制處理,處理後返回字串物件。我們發現但凡是值相同的字串經過 intern 機制處理之後,返回的都是同乙個字串物件,這種方式在處理大資料的時候無疑能節省更多的記憶體空間,系統無需為相同的字串重複分配記憶體,對於值相同的字串共用乙個物件即可。

其實,實現 intern 機制的方式非常簡單,就是通過維護乙個字串儲蓄池,這個池子是乙個字典結構,如果字串已經存在於池子中了就不再去建立新的字串,直接返回之前建立好的字串物件,如果之前還沒有加入到該池子中,則先構造乙個字串物件,並把這個物件加入到池子中去,方便下一次獲取,用偽**就可以描述為:

intern_pool = {}

defintern

(s):

if s in intern_pool:

return intern_pool[s]

else:

obj = pystringobject(s)

intern_pool[s] = obj

return obj複製**

在主流物件導向的程式語言中intern 機制對於處理字串已經成為一種標配,通過 intern 機制可以提高字串的處理效率,當然,直譯器內部很對 intern 機制的使用策略是有考究的,有些場景會自動使用 intern ,有些地方需要通過手動方式才能啟動。比如:

>>> s1 = "hello"

>>> s2 = "hello"

>>> s1 is s2

true

>>> id(s1)

72320704l

>>> id(s2)

72320704l

複製**

這段**就是 python自動使用了intern機制的結果。

Python中字串的intern機制

intern機制 字串型別作為python中最常用的資料型別之一,python直譯器為了提高字串使用的效率和使用效能,做了很多優化,例如 python直譯器中使用了 intern 字串駐留 的技術來提高字串效率,什麼是intern機制?即值同樣的字串物件僅僅會儲存乙份,放在乙個字串儲蓄池中,是共用的...

了解intern ,了解字串常量池

intern 是string乙個api,平時不常用,但是面試可能會考,掌握intern可避免被面試官問到時大眼瞪小眼的尷尬局面。當乙個string物件呼叫intern 方法時,會首先檢查字串常量池中是否存在equals相等的字串,若存在直接返回常量池中該字串物件,否則建立該字串物件並放入字串常量池。...

字串intern方法與大廠面試題解

intern方法 intern方法的作用就是嘗試將乙個字串放入stringtable中,如果不存在就放入stringtable並返回stringtable中的位址 如果這個字串是通過2個new string 用 鏈結的方式建立的,呼叫intern方法則stringtable內放置的就是new str...