今晚在做
上的python小練習0011題時,一直出現以下『utf-8』無法decode的問題:
utf8' codec can't decode byte 0xb1 in position 0: invalid start byte
即使我借鑑
中errors = 『replace』的形式,雖然錯誤沒有了,但訓練目標卻也達不到。
摸索了很長世間,最後還是用gb18030編碼解決了問題,只是原因尚不自知,在此附上**,下次若出現類似問題,多用幾種編碼形式試試。
__author__ = 'moon.d.carl'
# -*- coding:'utf-8' -*-
#敏感詞文字檔案 filtered_words.txt,裡面的內容為以下內容,當使用者輸入敏感詞語時,則列印出 freedom,否則列印出 human rights。
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
path = 'e:/python_practise_material/0011.txt'
filtered_words = [words.strip('\n').decode('gb18030') for words in open(path, 'r')]
input_word = raw_input()
print 'freedom' if unicode(input_word, 'gb18030') in filtered_words else 'human rights'
Python讀取TXT檔案時出現「ufeff「字元
問題描述 目的 在command.txt檔案中讀取文字,然後轉換成數字列表。這是 內容 cmd open command.txt rt encoding utf 8 datals for line in cmd line line.replace n for ls in datals print l...
Python 讀取TXT檔案
一 開啟檔案 f open filename,access mode r buffering 1 filename 檔名 access mode 開啟方式,r讀,w寫,a追加,r w a 都是以讀寫方式開啟,rb二進位制讀,wb二進位制寫,rb wb ab 二進位制讀寫 buffering 預設值 ...
python 讀取txt檔案
txt檔案內容 1.全部讀取 file open e others 測試.txt r 開啟檔案 f all file.read 讀取所有檔案內容 print f all file.close 關閉檔案結果 2.按行讀取 file open e others 測試.txt r 開啟檔案 for lin...