python與字符集編碼

2021-09-08 11:22:08 字數 298 閱讀 2072

講的比較明白的部落格:

以上面博文的漢為例子,漢字的gbk編碼是baba, unicode碼字是6c49 utf16-le編碼是496c,utf-8編碼是e6b189

python檔案的編碼制定為gbk

line="漢"

input=line.decode('gbk','ignore').encode("utf-8"); 

rint repr(input)

以上三行**輸出正確,但是當編碼變為utf-16le的時候,就不行了。 這時需要用print binascii.hexlify(input)

字符集與編碼

前言 今天notepad 檢視測試傳過來的乙個log,開啟後竟然有部分亂碼,無法檢視完整資訊,嘗試更改編碼後仍未能解決,同事告知使用瀏覽器開啟或許可以,於是搗鼓一下,使用瀏覽器開啟並選擇編碼unicode utf 8 後終於正常顯示,順利解決問題。亂碼顯示的問題以前也經常遇到,從未認真對待過,剛好稱...

字符集與編碼

這些東西是自己在知乎上看的,摘抄下來,以便以後查閱,主要內容有 字符集與編碼 byte order mark等。在windows中經常需要用到多字元與寬字元的轉換方法,多字元 multichar 也就是ansi編碼的方式,而寬字元 widechar 也就是unicode編碼的方式。ansi是預設的編...

字符集與編碼

乙個位元 bit 可以是0,或者是1,8個位元 bit 組成乙個位元組 byte 全為0時代表數字0,全為1時代表數字255。乙個位元組可以表示256個數字,兩個位元組可以表示65536個數字。更多的位元組,可以有更多的組合,就可以表示更大的數值範圍。整數可以這麼存,那字元呢?一堆二進位制的0和1,...