字串在 python 中是最簡單也是最常用的資料型別之一,在 cpython 中字串的實現原理使用了一種叫做 intern(字串駐留)的技術來提高字串效率。究竟什麼是 intern 機制,這種機制又是通過什麼方式來提高字串效率的呢?希望這篇文章能夠拋磚引玉。
先來看一段**:
>>> s3 = "hello!"
>>> s4 = "hello!"
>>> s3 is s4
false
>>> id(s3)
80325968l
>>> id(s4)
80326048l
複製**
s3 和 s4 雖然值是一樣的,但確確實實是兩個不同的字串物件,python 會為它們倆各自分配一段記憶體空間,假設程式中存在大量值相同的字串,系統就不得不為每個字串重複地分配記憶體空間,顯然,對系統來說是一種無謂的資源浪費。為了解決這種問題,python 引入了 intern 機制。
再來看:
>>> s3 = intern('hello!')
>>> s4 = intern('hello!')
>>> s3 is s4
true
>>> id(s3)
80325968l
>>> id(s4)
80325968l
複製**
intern
是 python 中的乙個內建函式,該函式的作用就是對字串進行 intern 機制處理,處理後返回字串物件。我們發現但凡是值相同的字串經過 intern 機制處理之後,返回的都是同乙個字串物件,這種方式在處理大資料的時候無疑能節省更多的記憶體空間,系統無需為相同的字串重複分配記憶體,對於值相同的字串共用乙個物件即可。
其實,實現 intern 機制的方式非常簡單,就是通過維護乙個字串儲蓄池,這個池子是乙個字典結構,如果字串已經存在於池子中了就不再去建立新的字串,直接返回之前建立好的字串物件,如果之前還沒有加入到該池子中,則先構造乙個字串物件,並把這個物件加入到池子中去,方便下一次獲取,用偽**就可以描述為:
intern_pool = {}
defintern
(s):
if s in intern_pool:
return intern_pool[s]
else:
obj = pystringobject(s)
intern_pool[s] = obj
return obj複製**
在主流物件導向的程式語言中intern 機制對於處理字串已經成為一種標配,通過 intern 機制可以提高字串的處理效率,當然,直譯器內部很對 intern 機制的使用策略是有考究的,有些場景會自動使用 intern ,有些地方需要通過手動方式才能啟動。比如:
>>> s1 = "hello"
>>> s2 = "hello"
>>> s1 is s2
true
>>> id(s1)
72320704l
>>> id(s2)
72320704l
複製**
這段**就是 python自動使用了intern機制的結果。 Python中字串的intern機制
intern機制 字串型別作為python中最常用的資料型別之一,python直譯器為了提高字串使用的效率和使用效能,做了很多優化,例如 python直譯器中使用了 intern 字串駐留 的技術來提高字串效率,什麼是intern機制?即值同樣的字串物件僅僅會儲存乙份,放在乙個字串儲蓄池中,是共用的...
了解intern ,了解字串常量池
intern 是string乙個api,平時不常用,但是面試可能會考,掌握intern可避免被面試官問到時大眼瞪小眼的尷尬局面。當乙個string物件呼叫intern 方法時,會首先檢查字串常量池中是否存在equals相等的字串,若存在直接返回常量池中該字串物件,否則建立該字串物件並放入字串常量池。...
字串intern方法與大廠面試題解
intern方法 intern方法的作用就是嘗試將乙個字串放入stringtable中,如果不存在就放入stringtable並返回stringtable中的位址 如果這個字串是通過2個new string 用 鏈結的方式建立的,呼叫intern方法則stringtable內放置的就是new str...