python讀取txt檔案時的中文亂碼問題

今晚在做

上的python小練習0011題時，一直出現以下『utf-8』無法decode的問題：

utf8' codec can't decode byte 0xb1 in position 0: invalid start byte

即使我借鑑

中errors = 『replace』的形式，雖然錯誤沒有了，但訓練目標卻也達不到。

摸索了很長世間，最後還是用gb18030編碼解決了問題，只是原因尚不自知，在此附上**，下次若出現類似問題，多用幾種編碼形式試試。

__author__ = 'moon.d.carl'
# -*- coding:'utf-8' -*-
#敏感詞文字檔案 filtered_words.txt，裡面的內容為以下內容，當使用者輸入敏感詞語時，則列印出 freedom，否則列印出 human rights。
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
path = 'e:/python_practise_material/0011.txt'
filtered_words = [words.strip('\n').decode('gb18030') for words in open(path, 'r')]
input_word = raw_input()
print 'freedom' if unicode(input_word, 'gb18030') in filtered_words else 'human rights'

Python讀取TXT檔案時出現「ufeff「字元

問題描述目的在command.txt檔案中讀取文字，然後轉換成數字列表。這是內容 cmd open command.txt rt encoding utf 8 datals for line in cmd line line.replace n for ls in datals print l...

Python 讀取TXT檔案

一開啟檔案 f open filename,access mode r buffering 1 filename 檔名 access mode 開啟方式，r讀，w寫，a追加，r w a 都是以讀寫方式開啟，rb二進位制讀，wb二進位制寫，rb wb ab 二進位制讀寫 buffering 預設值 ...

python 讀取txt檔案

txt檔案內容 1.全部讀取 file open e others 測試.txt r 開啟檔案 f all file.read 讀取所有檔案內容 print f all file.close 關閉檔案結果 2.按行讀取 file open e others 測試.txt r 開啟檔案 for lin...

python讀取txt檔案時的中文亂碼問題

Python讀取TXT檔案時出現「ufeff「字元

Python 讀取TXT檔案

python 讀取txt檔案

相關推薦