Python拼接字串的7種方法總結

前言

忘了在哪看到一位程式設計大牛調侃，他說程式設計師每天就做兩件事，其中之一就是處理字串。相信不少同學會有同感。

在python中，我們經常會遇到字串的拼接問題，幾乎任何一種程式語言，都把字串列為最基礎和不可或缺的資料型別。而拼接字串是必備的一種技能。今天，我跟大家一起來學習python拼接字串的七種方式。

下面話不多說了，來一起看看詳細的介紹吧

1、來自c語言的%方式

print('%s %s' % ('hello', 'world'))
>>> hello world

%號格式化字串的方式繼承自古老的c語言，這在很多程式語言都有類似的實現。上例的%s是乙個佔位符，它僅代表一段字串，並不是拼接的實際內容。實際的拼接內容在乙個單獨的%號後面，放在乙個元組裡。

類似的佔位符還有：%d（代表乙個整數）、%f（代表乙個浮點數）、%x（代表乙個16進製制數），等等。%佔位符既是這種拼接方式的特點，同時也是其限制，因為每種佔位符都有特定意義，實際使用起來太麻煩了。

2、format()拼接方式

# 簡潔版
s1 = 'hello {}! my name is {}.'.format('world', 'python貓')
print(s1)
>>>hello world! my name is python貓.
# 對號入座版
s2 = 'hello ! my name is .'.format('world', 'python貓')
s3 = 'hello ! my name is .'.format(name1='world', name2='python貓')
print(s2)
>>>hello world! my name is python貓.
print(s3)
>>>hello world! my name is python貓.

這種方式使用花括號{}做佔位符，在format方法中再轉入實際的拼接值。容易看出，它實際上是對%號拼接方式的改進。這種方式在python2.6中開始引入。

上例中，簡潔版的花括號中無內容，缺點是容易弄錯次序。對號入座版主要有兩種，一種傳入序列號，一種則使用key-value的方式。實戰中，我們更推薦後一種，既不會數錯次序，又更直觀可讀。

3、() 類似元組方式

s_tuple = ('hello', ' ', 'world')
s_like_tuple = ('hello' ' ' 'world')
print(s_tuple) 
>>>('hello', ' ', 'world')
print(s_like_tuple) 
>>>hello world
type(s_like_tuple) 
>>>str

注意，上例中s_like_tuple並不是乙個元組，因為元素間沒有逗號分隔符，這些元素間可以用空格間隔，也可以不要空格。使用type()檢視，發現它就是乙個str型別。我沒查到這是啥原因，猜測或許()括號中的內容是被python優化處理了。

這種方式看起來很快捷，但是，括號()內要求元素是真實字串，不能混用變數，所以不夠靈活。

# 多元素時，不支援有變數
str_1 = 'hello'
str_2 = (str_1 'world')
>>> syntaxerror: invalid syntax
str_3 = (str_1 str_1)
>>> syntaxerror: invalid syntax
# 但是下面寫法不會報錯
str_4 = (str_1)

4、物件導向模板拼接

from string import template
s = template('$ $!') 
print(s.safe_substitute(s1='hello',s2='world')) 
>>> hello world!

說實話，我不喜歡這種實現方式。濃濃的一股被物件導向思想毒害的臭味。

就不多說了。

5、常用的+號方式

str_1 = 'hello world！ '
str_2 = 'my name is python貓.'
print(str_1 + str_2)
>>>hello world！ my name is python貓.
print(str_1)
>>>hello world！

這種方式最常用、直觀、易懂，是入門級的實現方式。但是，它也存在兩處讓人容易犯錯的地方。

首先，新入門程式設計的同學容易犯錯，他們不知道字串是不可變型別，新的字串會獨佔一塊新的記憶體，而原來的字串保持不變。上例中，拼接前有兩段字串，拼接後實際有三段字串。

其次，一些有經驗的老程式設計師也容易犯錯，他們以為當拼接次數不超過3時，使用+號連線符就會比其它方式快（ps：不少python教程都是如此建議），但這沒有任何合理根據。

事實上，在拼接短的字面值時，由於cpython中的常數摺疊（constant folding）功能，這些字面值會被轉換成更短的形式，例如'a'+'b'+'c' 被轉換成'abc'，'hello'+'world'也會被轉換成'hello world'。這種轉換是在編譯期完成的，而到了執行期時就不會再發生任何拼接操作，因此會加快整體計算的速度。

常數摺疊優化有乙個限度，它要求拼接結果的長度不超過20。所以，當拼接的最終字串長度不超過20時，+號操作符的方式，會比後面提到的join等方式快得多，這與+號的使用次數無關。

題外話：你是否覺得20這個數字很熟悉呢？沒錯，我們之前在《python中的「特權種族」是什麼？》中提到過，字串類的特權種族也是以20為限。當時也有乙個例子，展示了編譯期和執行期的區別，建議你去回看。

6、join()拼接方式

str_list = ['hello', 'world']
str_join1 = ' '.join(str_list)
str_join2 = '-'.join(str_list)
print(str_join1) >>>hello world
print(str_join2) >>>hello-world

str物件自帶的join()方法，接受乙個序列引數，可以實現拼接。拼接時，元素若不是字串，需要先轉換一下。可以看出，這種方法比較適用於連線序列物件中（例如列表）的元素，並設定統一的間隔符。

當拼接長度超過20時，這種方式基本上是首選。不過，它的缺點就是，不適合進行零散片段的、不處於序列集合的元素拼接。

7、f-string方式

name = 'world'
myname = 'python_cat'
words = f'hello . my name is .'
print(words)
>>> hello world. my name is python_cat.

f-string方式出自pep 498（literal string interpolation，字面字串插值），從python3.6版本引入。其特點是在字串前加 f 標識，字串中間則用花括號{}包裹其它字串變數。

這種方式在可讀性上秒殺format()方式，處理長字串的拼接時，速度與join()方法相當。

儘管如此，這種方式與其它某些程式語言相比，還是欠優雅，因為它引入了乙個 f 標識。而其它某些程式語言可以更簡練，比如shell：

name="world"
myname="python_cat"
words="hello $. my name is $."
echo $words
>>>hello world. my name is python_cat.

總結一下，我們前面說的「字串拼接」，其實是從結果上理解。若從實現原理上劃分的話，我們可以將這些方法劃分出三種型別：

當要處理字串列表等序列結構時，採用join()方式；拼接長度不超過20時，選用+號操作符方式；長度超過20的情況，高版本選用f-string，低版本時看情況使用format()或join()方式。

Python拼接字串的7種方法總結

拼接數字 Python中字串拼接的三種方式

Python拼接字串的7種方法總結

python3 拼接字串的7種方法

Python拼接字串的7種方法總結

拼接數字 Python中字串拼接的三種方式

Python拼接字串的7種方法總結

python3 拼接字串的7種方法

相關推薦