python中編碼的特點:
1,各個編碼之間的二進位制是不能互相識別的,會產生亂碼
2,檔案的儲存和傳輸是不能用unicode的
在python3中字串在記憶體中是用unicode編碼的,而要完成儲存和傳輸則要將str轉換為bytes型別。bytes的操作方式和str相同,但是它的編碼和str不同,可以是utf-8,gbk,gb2312等等。
str → bytes的方法是str.encode(編碼方式)
#encode() 表現形式是將str轉變為bytes 編碼方式是將unicode轉換為utf-8,gbk,gb2312等等
#英文,數字和特殊字元轉換為bytes後前面加了個b
s = '
zxc'
print(s.encode('
utf-8
')) #
b'zxc'#中文
s = '
蔠纈草'
print(s.encode('
utf-8
')) #
b'\xe8\x94\xa0\xe7\xbc\xac\xe8\x8d\x89'
bytes → str的方法是bytes.decode()
#decode 解碼
s = '自'
b = s.encode('
utf-8
') #
編碼print
(b)print(b.decode('
utf-8
')) #
解碼
python基礎之字元編碼
1.什麼是字元編碼?字元 標準 字元編碼 數字 2.為什麼要編碼?讓計算機認識人的字元 3.常見的字元編碼 ascii 乙個bytes代表乙個字元 英文本元 鍵盤上的所有其他字元 1bytes 8bit,8bit可以表示0 2 8 1種變化,即可表示256個字元 gbk 2bytes代表乙個字元,由...
python基礎 之字元編碼
一 何謂編碼 二 編碼發展簡述 assic 英文編碼表 unicode 後各國均發展自己的編碼表,導致編碼表混亂,推出萬國碼unicode utf 8 但unicode存乙個字元,統一占用2個位元組,占用空間較大。又推出utf 8,可以根據語言型別,自動調整儲存空間 三 編碼儲存說明 1位 1bit...
Python基礎之字元的編碼
python廖雪峰 計算機只能處理二進位制數字 0100111 要處理文字,就必須先把文字轉為數字才能處理,這個過程就叫編碼。由於計算機是美國人發明的,最早只有127個字元被編碼到計算機裡,包括大小寫英文本母 陣列和一些符號,這個編碼表被稱為ascii編碼,比如大寫字母a的編碼是65,小寫字母z的編...