如果**檔案需要制定編碼格式如utf-8:
1.要在檔案開始時寫如下注釋
# coding=utf-8
2.或則 使用以下**
import sys
reload sys
sys.setdefaultencoding('utf-8')
說明:unicode支援不同的編碼方式,最著名的的是utf-8. ascii字元 的utf-8 編碼 與ascii編碼完全一致。
此外,在程式中不要使用string模組,使用unicode()和unichar()函式代替str()和chr() 函式 (python 3.x 中 str() chr() 預設支援unicode)
一般對檔案操作、socket操作,需要把內容轉換為utf-8,處理完後再轉換回來。
如 以utf-8編碼格式 寫入檔案, 讀檔案後 可進行解碼
# coding=utf-8
def toutf_8(s):
if type(s).__name__=='unicode':
return s.encode('utf-8')
else:
return s
def tounicode(s):
if type(s).__name__!='unicode':
return s.decode('utf-8')
else:
return s
codec = 'utf-8'
file = 'unicode.txt'
hello_out = u"世界\n"
bytes_out = toutf_8(hello_out)
f = open(file, "w")
f.write(bytes_out)
f.close()
f = open(file, "r")
bytes_in = f.read()
f.close()
hello_in = tounicode(bytes_in)
print hello_in
Python學習筆記 Unicode
這裡簡單的說一下。下面內容基本上時從 python.core.programming.2ed 上摘的 unicode是計算機可以支援這個星球上的多種語言的秘密 在unicode之前,用的都是ascii,ascii嗎非常簡單,每個英文本元都用7位二進位制數的方式儲存在計算機內,其範圍是32到126.它...
Python學習筆記 Unicode
內容摘自 python核心程式設計 unicode是計算機可以支援這個星球上的多種語言的秘密 在unicode之前,用的都是ascii,ascii嗎非常簡單,每個英文本元都用7位二進位制數的方式儲存在計算機內,其範圍是32到126.它的實現原理這裡也不說了。但是ascii碼只能表示95個可列印的字元...
Python學習筆記 Unicode
普通字串可以用多種方式編碼成unicode字串,具體要看你究竟選擇了哪種編碼 unicodestring u hello world 將unicode轉化為普通python字串 encode utf8string unicodestring.encode utf 8 asciistring unic...