位元(bit) 計算機最小的儲存單位
位元組(byte)
1 bit = 1 位
8 bit = 1 byte
1024 bytes = 1 kb
1024 kb = 1 mb
1024 mb = 1 gb
只支援英文和拉丁文(七位ascii碼有128個。八位ascii碼有256個)
佔乙個位元組(byte)
1980 gb2312
1995 gbk1.0
2000 gb18030
unicode:utf-32 統一使用4個位元組
unicode:utf-16 2個位元組或2個位元組以上
unicode:utf-8 可變長的字元,英文1個位元組,中文3個位元組
encode()
在編碼的同時,將資料轉換為bytes型別
decode()
在解碼的同時,將bytes型別轉換為字串
b = byte = 位元組型別 = [0-255]
python3編碼解碼
輸入編碼 輸入編碼需要由二進位制轉為unicode,輸入介質 原始碼檔案 終端 檔案 網路等 python3預設是使用utf 8編碼對輸入的二進位制值轉為unicode。也就是說如果輸入介質沒有指定編碼,python3直譯器就預設把你的原始檔看成是utf 8編碼。呼叫sys.getdefaulten...
Python3的URL編碼解碼
前言 最近在用python3練習一些爬蟲指令碼的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 xx xx xx。如果出現3個百分號為乙個原字元則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的 from ...
python3編碼宣告 python3編碼問題彙總
這兩天寫了個監測網頁的爬蟲,作用是跟蹤乙個網頁的變化,但執行了一晚出現了乙個問題。希望大家不吝賜教!我用的是python3,錯誤在對html response的decode時丟擲,原樣為 response urllib.urlopen dsturl content response.read dec...