python檔案操作編碼

2021-10-05 05:15:26 字數 817 閱讀 8745

gbk編解碼器無法解碼,非法的多位元組序列。

**如下:

filename =

'11-0.txt'

with

open

(filename)

as file_object:

content = file_object.read(

)words = content.split(

) num =

len(words)

print

(num)

到這裡結合之前學習html的經驗,我明白應該是編碼問題,我的文件使用的是utf-8編碼方式,但是我的編輯器預設的是gbk,導致文件內容無法解碼所以讀入失敗。

在網上查詢之後發現了兩種方法

方法一:

with

open

(filename,

'rb'

)as file_object:

後面加的『rb』代表該檔案以二進位制開啟,utf-8的編碼形式本質上就是二進位制編碼,因此成功開啟。

方法二:

with

open

(filename,encoding=

'utf-8'

)as file_object:

這種方法相對上一種更為通用,直接在開啟檔案的時候規定編碼格式為utf-8,如果以後遇到其他編碼型別的檔案只要將encoding後面的編碼格式更換就可以成功。

(隨著認識加深,本篇博文會不斷更新)

python 編碼和檔案操作

在這裡插入 片 toc 編碼相關知識 encode 編碼函式 decode 解碼函式 in 77 s i am hhh in 79 s.encode out 79 b i am hhh in 80 s b i am hhh in 81 s.decode out 81 i am hhh file.re...

python檔案操作 字元編碼與檔案處理

本文目錄 一 字元編碼 二 檔案處理 應用程式 作業系統 計算機硬體 1.先啟動python直譯器 2.再將python檔案當作普通的文字檔案讀入記憶體 3.解釋執行讀入記憶體的 開始識別語法 字元編碼表 人類的字元 數字 1bytes 8bit 1b 8b 1位元組等於8個二進位制位 ascii碼...

python編碼,解碼,檔案的基本操作

字元 翻譯過程 數字 字元 翻譯過程 數字 中國 gbk 外國 日本 shift jis,美國ascii,南韓euc kr 國際統一 unicode進行編寫,訪問用utf 8,unicode與utf 8為特例他們兩個能夠相互識別 open r 檔案的路徑 預設為唯讀 完整的路徑為絕對路徑 如果檔案與...