歷史:ascll~unicode~utf-8
對於單個字元的編碼,python提供了ord()
函式獲取字元的整數表示,chr()
函式把編碼轉換為對應的字元:
>>> ord('a')
以unicode表示的str
通過encode()
方法可以編碼為指定的bytes
,例如:
>>> 'abc'.encode('ascii')
b'abc'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
>>> ord('中') 20013 >>> chr(66) 'b' >>> chr(25991) '文'
如果知道字元的整數編碼,還可以用十六進製制這麼寫str
:
>>> '\u4e2d\u6587'
'中文'
python對bytes
型別的資料用帶b
字首的單引號或雙引號表示:
x = b'abc'
要注意區分'abc'
和b'abc'
,前者是str
,後者雖然內容顯示得和前者一樣,但bytes
的每個字元都只占用乙個位元組。
以unicode表示的str
通過encode()
方法可以編碼為指定的bytes
,例如:
>>> 'abc'.encode('ascii')
b'abc'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
python學習筆記1 字串
小點總結 sentence input input the sentence words sentence.split 同樣適用於任何其它分隔符 9.letters list word 可以直接將word變成乙個list,其中每個元素都是乙個字母 判斷一句話中是否有正讀反讀都一樣的單詞 senten...
python學習筆記1 字串拼接
較為常用的字串拼接手法主要為兩種 1.通過format函式,形如 name input 姓名 age input 年齡 salary input 工資 info information1 of 姓名 n 年齡 n 工資 n format name name age age salary salary...
python筆記1 字串處理函式
對於re.findall 第三個引數預設為空 返回值為乙個列表 import re data re.findall r text,re.s 標記乙個子表示式的開始和結束位置,表示除換行符以外的乙個字元,前面內容可以出現0次或多次,前面的內容 子表達 可以出現0次或1次 如果不使用re.s引數,則只在...