一、何謂編碼
二、編碼發展簡述
assic【英文編碼表】 --> unicode【後各國均發展自己的編碼表,導致編碼表混亂,推出萬國碼unicode】 -->utf-8 【但unicode存乙個字元,統一占用2個位元組,占用空間較大。又推出utf-8,可以根據語言型別,自動調整儲存空間】
三、編碼儲存說明
1位 =1bit; 【最小單位,可理解為計算機二級制位數】
8bit = 1bytes = 1位元組;【每個字元統一用8個bit來表示,此處僅指英文及特殊字元類,共計255個】
1024bytes = 1kbytes = 1kb
1024kb = 1million bytes = 1mb = 1兆
1024mb = 1 gigabytes
1024gb = 1tb
四、編碼格式化輸出
一般用%d表示替換整數,%f表示替換浮點數,%s表示替換字串;
%運算子就是用來格式化字串的。有幾個%?佔位符,後面就跟幾個變數或者值,順序要對應好。如果只有乙個%?,括號可以省略。示例:
>>>'五、編碼與解碼1.在python2預設編碼是ascii, python3裡預設是unicodename: %s,age: %s
' % ('
jack
', 25)
'name:jack, age: 25
'
2.unicode 分為 utf-32(佔4個位元組),utf-16(佔兩個位元組),utf-8(佔1-4個位元組), so utf-16就是現在最常用的unicode版本, 不過在檔案裡存的還是utf-8,因為utf8省空間
3.在py3中encode,在轉碼的同時還會把string 變成bytes型別,decode在解碼的同時還會把bytes變回string
(此圖僅適用於py2)
gbk轉換為utf-8流程:
1.通過解碼【decode】轉換為unicode編碼
2.然後通過編碼【encode】轉換為utf-8編碼
utf-8轉換為gbk流程:
1.通過解碼【decode】轉換為unicode編碼
2.然後通過編碼【encode】轉換為gbk編碼
python基礎之字元編碼
1.什麼是字元編碼?字元 標準 字元編碼 數字 2.為什麼要編碼?讓計算機認識人的字元 3.常見的字元編碼 ascii 乙個bytes代表乙個字元 英文本元 鍵盤上的所有其他字元 1bytes 8bit,8bit可以表示0 2 8 1種變化,即可表示256個字元 gbk 2bytes代表乙個字元,由...
Python基礎之字元的編碼
python廖雪峰 計算機只能處理二進位制數字 0100111 要處理文字,就必須先把文字轉為數字才能處理,這個過程就叫編碼。由於計算機是美國人發明的,最早只有127個字元被編碼到計算機裡,包括大小寫英文本母 陣列和一些符號,這個編碼表被稱為ascii編碼,比如大寫字母a的編碼是65,小寫字母z的編...
python 基礎 字元編碼
編碼基礎 由於每個國家都有自己的字元,所以其對應關係也涵蓋了自己國家的字元,但是以上編碼都存在侷限性,即 僅涵蓋本國字元,無其他國家字元的對應關係。應運而生出現了萬國碼,他涵蓋了全球所有的文字和二進位制的對應關係。unicode 2 4位元組 已經收錄136690個字元,並還在一直不斷擴張中.uni...