#!/usr/bin/env python
#-*- coding: cp936 -*-
import codecs
import sys
if __name__ == '__main__':
if len(sys.argv) != 5:
print 'python %s infile decodetype outfile encodetype' % sys.argv[0]
sys.exit(1)
fin = codecs.open(sys.argv[1],'r',sys.argv[2])
fout = codecs.open(sys.argv[3],'w',sys.argv[4])
fout.write(''.join(fin.readlines()))
str = '中國人'
coco = codecs.lookup('gbk')
b = coco.decode(str)
print b[1],b[0],type(b[0])
b2 = coco.encode(b[0])
print b2[1],b2[0],type(b2[0])
Python編碼中的坑及處理方法
python虐我千百遍,我待python如初戀。使用python編寫模型指令碼,其中python的編碼讓我一路採坑。首先報的乙個錯誤就是 traceback most recent call last file line 1,in unicodedecodeerror ascii codec can...
python 中文編碼的處理
在win下寫點python的 對utf 8 老是處理不過來,並且解析一點漢字總會遇到一些漢字的編碼問題。下決心把它解決掉。1 嘗試第一種方式 utf8string utf8string.decode utf 8 utf8string utf8string.encode gbk 這個時候顯示基本上是正...
python處理檔案編碼
對於儲存自然語言的檔案,有可能採用了不同的編碼,例如漢字的編碼就有多種,utf 8,gb2312,gb18030,iso 8859等字元編碼格式。當處理各種檔案的時候,就需要在各種檔案格式之間轉換,由於utf 8字元編碼格式相容於ascii,且多位元組編碼,不存在大小端的問題,可以使用已有的c語言庫...