Python實用筆記 (1)字串與編碼

2022-06-13 08:36:08 字數 1043 閱讀 3288

歷史:ascll~unicode~utf-8

對於單個字元的編碼,python提供了ord()函式獲取字元的整數表示,chr()函式把編碼轉換為對應的字元:

>>> ord('a')

以unicode表示的str通過encode()方法可以編碼為指定的bytes,例如:

>>> 'abc'.encode('ascii')

b'abc'

>>> '中文'.encode('utf-8')

b'\xe4\xb8\xad\xe6\x96\x87'

>>> ord('中') 20013 >>> chr(66) 'b' >>> chr(25991) '文' 

如果知道字元的整數編碼,還可以用十六進製制這麼寫str

>>> '\u4e2d\u6587'

'中文'

python對bytes型別的資料用帶b字首的單引號或雙引號表示:

x = b'abc'

要注意區分'abc'b'abc',前者是str,後者雖然內容顯示得和前者一樣,但bytes的每個字元都只占用乙個位元組。

以unicode表示的str通過encode()方法可以編碼為指定的bytes,例如:

>>> 'abc'.encode('ascii')

b'abc'

>>> '中文'.encode('utf-8')

b'\xe4\xb8\xad\xe6\x96\x87'

python學習筆記1 字串

小點總結 sentence input input the sentence words sentence.split 同樣適用於任何其它分隔符 9.letters list word 可以直接將word變成乙個list,其中每個元素都是乙個字母 判斷一句話中是否有正讀反讀都一樣的單詞 senten...

python學習筆記1 字串拼接

較為常用的字串拼接手法主要為兩種 1.通過format函式,形如 name input 姓名 age input 年齡 salary input 工資 info information1 of 姓名 n 年齡 n 工資 n format name name age age salary salary...

python筆記1 字串處理函式

對於re.findall 第三個引數預設為空 返回值為乙個列表 import re data re.findall r text,re.s 標記乙個子表示式的開始和結束位置,表示除換行符以外的乙個字元,前面內容可以出現0次或多次,前面的內容 子表達 可以出現0次或1次 如果不使用re.s引數,則只在...