****************************************=== 輸入編碼
輸入編碼需要由二進位制轉為unicode,輸入介質:原始碼檔案、終端、檔案、網路等
python3預設是使用utf-8編碼對輸入的二進位制值轉為unicode。 也就是說如果輸入介質沒有指定編碼,python3直譯器就預設把你的原始檔看成是utf-8編碼。
呼叫sys.getdefaultencoding()可以檢視到是utf-8編碼。
輸入介質指定編碼的方法:
1、原始碼檔案:在原始檔第二行指定:# -*- coding: utf-8 -*-
2、檔案:f = open("e:\\python\\zw.txt", "r", encoding = "utf-8")
3、終端:export lang="en_us.utf-8"或者sys.stdin= open(sys.stdin.fileno(), mode='w', encoding='utf8', buffering=1)
4、。。。
****************************************=== 輸出編碼
輸出編碼需要由unicode轉為二進位制,輸出介質:終端、檔案、網路等
***********************************=== 檢視unicode
>>> s = '\u7f51\u7edc\u7c7b\u578b'
>>> s
'網路型別'
>>> print(s.encode("unicode_escape").decode("u8"))
\u7f51\u7edc\u7c7b\u578b
>>>
python3 編碼解碼
位元 bit 計算機最小的儲存單位 位元組 byte 1 bit 1 位 8 bit 1 byte 1024 bytes 1 kb 1024 kb 1 mb 1024 mb 1 gb 只支援英文和拉丁文 七位ascii碼有128個。八位ascii碼有256個 佔乙個位元組 byte 1980 gb2...
Python3的URL編碼解碼
前言 最近在用python3練習一些爬蟲指令碼的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 xx xx xx。如果出現3個百分號為乙個原字元則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的 from ...
python3編碼宣告 python3編碼問題彙總
這兩天寫了個監測網頁的爬蟲,作用是跟蹤乙個網頁的變化,但執行了一晚出現了乙個問題。希望大家不吝賜教!我用的是python3,錯誤在對html response的decode時丟擲,原樣為 response urllib.urlopen dsturl content response.read dec...