一種編碼想要轉成另一種編碼,需要先解碼成萬國碼:unicode,然後再從unicode轉成其他編碼。
例如gbk格式想要轉成utf-8,需要先按照 gbk 的格式 decode 成 unicode,再從 unicode 格式 encode 成utf-8
#python3預設使用utf-8編碼,故不用宣告:#-*- coding:utf-8 -*-
import
sys#
檢視當前預設編碼
(sys.getdefaultencoding())
name = '你好'
#utf-8格式,是unicode型別,這是python3預設的型別
name_utf8 = name.encode('
utf-8
') #
編碼成utf-8
name_gbk = name.encode('
gbk') #
編碼成gbk; utf-8也是unicode,可以直接編碼成其他型別:gbk
(name_utf8)
(name_gbk)
print(name_gbk.decode('
gbk')) #
gbk先按照gbk的格式解碼成unicode,然後才能編碼成其他型別
print(name_gbk.decode('
gbk').encode('
utf-8
')) #
gbk轉utf-8,過程: gbk->unicode->utf-8
編碼 解碼 python
之前一直對python檔案中編碼解碼糊里糊塗,今天看到一篇文章,覺得把我講的有點明白了。寫個心得吧。1 編碼解碼是怎麼一回事?python 裡面的編碼和解碼也就是 unicode 和 str 這兩種形式的相互轉化。編碼是 unicode str,相反的,解碼就是 str unicode。str形式,...
PYTHON編碼和解碼
從第一天接觸python就對解碼和編碼的問題很困惑,最近在學習網路資料爬蟲,又遇到了一系列的解碼和編碼問題,處理中文編碼問題真的好麻煩,這次真的需要好好填坑了。詳細內容下面的文章 python字串的編碼與解碼 encode與decode 字串在python內部的表示是unicode編碼,因此,在做編...
python 檔案編碼 解碼
ascii ascii碼是西歐編碼的方式,採取7位編碼,所以是2 7 128,共可以表示128個字元,包括34個字元,如換行lf,回車cr等 其餘94位為英文本母和標點符號及運算符號等。gb2321 gb2312 是對 ascii 的中文擴充套件。相容ascii。編碼規定 編碼小於127的字元與as...