python字元編碼

2022-08-13 04:54:11 字數 497 閱讀 6033

1.asiic 8位表示乙個字元 1位元組(bye) = 8字位 =8個二進位制數,asiic碼一般第一位都為0

2.unicode(萬國碼)2個位元組表示乙個字元,改版後4個位元組表示乙個字元

3.unicode公升級版:utf-8:最少用乙個位元組標識乙個字元,utf-16:最少用兩個位元組表示乙個字元

a:用乙個位元組標識乙個字元

歐洲文字:用兩個位元組表示乙個字元

亞洲文字:用三個位元組表示乙個字元

4.gbk:國標,中國人自己使用,只包含英文與中文

乙個英文乙個位元組

乙個中文兩個位元組

python字元編碼

ascii 碼是乙個位元組,通常只能顯示英文本母和數字。unicode碼為了顯示多種語言產生,但是要占用兩個位元組,顯示文字要占用大量空間 utf 8 為了節約空間而生,英文本元只用乙個位元組儲存,中文字元需要三個位元組 character ascii unicode utf 8 a01000000...

python字元編碼

列印python檔案編碼 import sys print sys.getdefaultencoding 中文的乙個字元unicode占用2個位元組。對在於ascii字元占用1個位元組 utf 8中 中文字元佔3個位元組,英文本元占用1個位元組 編碼和轉碼 unicode不能再解碼了 它是基層的 u...

Python字元編碼

在用python程式設計中,字串有兩種表示方法 string 和 u string 為什麼字串要是用這兩種表達方式。不是僅僅用前一種呢?使用type 函式檢視,它們各自是str物件和unicode物件。這兩個物件有什麼差別嗎?還有經經常使用到的encode 和decode 又是幹什麼的呢?都說pyt...