為了將各種不同的語言都包括在同一的字符集中,滿足國際間的資訊交流國際上制定了unicode字符集。
通過使用unicode字符集能夠滿足跨語言的文書處理,有效的避免亂碼產生。
用法:在指令碼中新增下面**行之中的乙個
#-*- coding:utf-8 -*-
#coding:utf-8
注意:假設是在命令列輸出中文,則須要設定編碼為cp936,
檔案格式儲存為utf-8編碼
演示樣例**:
#coding:utf-8
ch = '在中使用中文須要注意字元編碼問題'
print ch
print ch.decode('utf-8').encode('cp936')
執行結果:
在eclipse下執行:
在dos窗體下執行:
原因:windows命令列採用的是cp936
,指令碼採用utf-8編碼導致亂碼。在指令碼中才用decode和encode函式對字元又一次解碼編碼,或者,不將其儲存為uft-8格式
python 學習 unicode 編碼
如果 檔案需要制定編碼格式如utf 8 1.要在檔案開始時寫如下注釋 coding utf 8 2.或則 使用以下 import sys reload sys sys.setdefaultencoding utf 8 說明 unicode支援不同的編碼方式,最著名的的是utf 8.ascii字元 的...
關於python編碼學習
為什麼會報錯 unicodeencodeerror ascii codec can t encode characters in position 0 1 ordinal not in range 128 本文就來針對編碼進行學習講解下。字串在python內部的表示是unicode編碼,因此,在做編...
學習python處理python編碼問題
一 幾種常見的 編碼格式。1.1 ascii,用1個位元組表示。1.2 utf 8,用1個至三個位元組表示,表示ascii碼時只占用1個位元組,ascii編碼是utf 8的子集。1.3 utf 16,用2個位元組表示,在python 中,unicode的含義就是utf 16。二 python原始檔的...