讀寫檔案是最常見的io操作。python內建了讀寫檔案的函式,用法和c是相容的。
讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件(通常稱為檔案描述符),然後,通過作業系統提供的介面從這個檔案物件中讀取資料(讀檔案),或者把資料寫入這個檔案物件(寫檔案)。
1.讀檔案
要以讀檔案的模式開啟乙個檔案物件,使用python內建的open()函式,傳入檔名和標示符
f = open(「read.txt」,「r」) # 第乙個引數是要開啟的檔案,第二個引數是以什麼方式開啟,r代表唯讀
print(f.read())
f = open(「e:/study2019/pythonworkspace/read.txt」,「r」)
print(f.read())
# 這裡需要轉譯
f = open(「e:\study2019\pythonworkspace\read.txt」,「r」)
print(f.read())
hello world
hello kitty
標示符』r』表示讀,這樣,我們就成功地開啟了乙個檔案。
如果檔案不存在,open()函式就會丟擲乙個ioerror的錯誤
最後一步是呼叫close()方法關閉檔案。檔案使用完畢後必須關閉,因為檔案物件會占用作業系統的資源,並且作業系統同一時間能開啟的檔案數量也是有限的。由於檔案讀寫時都有可能產生ioerror,一旦出錯,後面的f.close()就不會呼叫。所以,為了保證無論是否出錯都能正確地關閉檔案,python引入了with語句來自動幫我們呼叫close()方法
with open(「read.txt」,「r」) as f:
print(f.read())
呼叫read()會一次性讀取檔案的全部內容,如果檔案有10g,記憶體就爆了,所以,要保險起見,可以反覆呼叫read(size)方法,每次最多讀取size個位元組的內容。另外,呼叫readline()可以每次讀取一行內容,呼叫readlines()一次讀取所有內容並按行返回list。因此,要根據需要決定怎麼呼叫。
如果檔案很小,read()一次性讀取最方便;如果不能確定檔案大小,反覆呼叫read(size)比較保險;如果是配置檔案,呼叫readlines()最方便
操作大檔案高階寫法,不會撐爆記憶體
f =open (「read.txt」,「r」)
for line in f :
print(line)
2.二進位制檔案
with open(「pic.png」,「rb」) as f:
print(f.read())
3.字元編碼
要讀取非utf-8編碼的文字檔案,需要給open()函式傳入encoding引數,例如,讀取gbk編碼的檔案
with open(「a.txt」,「r」,encoding=「utf-8」) as f:
print(f.read())
with open(「b.txt」,「r」,encoding=「gbk」) as f:
print(f.read())
遇到有些編碼不規範的檔案,你可能會遇到unicodedecodeerror,因為在文字檔案中可能夾雜了一些非法編碼的字元。遇到這種情況,open()函式還接收乙個errors引數,表示如果遇到編碼錯誤後如何處理。最簡單的方式是直接忽略
with open(「list.py」,「r」,errors=「ignore」) as f:
print(f.read())
with open(「list.py」,「r」,encoding=「utf-8」,errors=「ignore」) as f:
print(f.read())
4.寫檔案
寫檔案和讀檔案是一樣的,唯一區別是呼叫open()函式時,傳入識別符號』w』或者』wb』表示寫文字檔案或寫二進位制檔案
with open(「write.py」,「w」,encoding=「utf-8」) as f:
f.write(「我是老王」)
可以反覆呼叫write()來寫入檔案,但是務必要呼叫f.close()來關閉檔案。當我們寫檔案時,作業系統往往不會立刻把資料寫入磁碟,而是放到記憶體快取起來,空閒的時候再慢慢寫入。只有呼叫close()方法時,作業系統才保證把沒有寫入的資料全部寫入磁碟。忘記呼叫close()的後果是資料可能只寫了一部分到磁碟,剩下的丟失了。所以,還是用with語句來得保險
要寫入特定編碼的文字檔案,請給open()函式傳入encoding引數,將字串自動轉換成指定編碼
5.讀寫常用模式
r 開啟唯讀檔案,該檔案必須存在。
r+ 開啟可讀寫的檔案,該檔案必須存在。
w 開啟只寫檔案,若檔案存在則檔案長度清為0,即該檔案內容會消失。若檔案不存在則建立該檔案。
w+ 開啟可讀寫檔案,若檔案存在則檔案長度清為零,即該檔案內容會消失。若檔案不存在則建立該檔案。
a 以附加的方式開啟只寫檔案。若檔案不存在,則會建立該檔案,如果檔案存在,寫入的資料會被加到檔案尾,即檔案原先的內容會被保留。
a+ 以附加方式開啟可讀寫的檔案。若檔案不存在,則會建立該檔案,如果檔案存在,寫入的資料會被加到檔案尾後,即檔案原先的內容會被保留。
上述的形態字串都可以再加乙個b字元,如rb、w+b或ab+等組合,加入b 字元用來告訴函式庫開啟的檔案為二進位制檔案,而非純文字檔案。不過在posix系統,包含linux都會忽略該字元。
檔案操作 讀寫檔案
對檔案的讀寫操作應該是最重要的檔案操作,system.io命名空間提供了諸多檔案讀寫操作類,對檔案內容進行操作常見有3種方式 文字模式 二進位制模式以及非同步模式。1 文字模式 streamreader 和streamwriter類提供了按文字模式讀寫資料的方法。1.1 streamreader 類...
讀寫檔案操作
匯入領導簡歷資訊 return public string leaderresumeimport throws ioexceptionelse if fr null fr.close if flag else fw.close string sjson outputclient sjson retu...
檔案讀寫操作
函式原型 file fopen const char filename,const char mode 返回值 檔案順利開啟後,指向該流的檔案指標就會被返回。如果檔案開啟失敗則返回null,並把錯誤 存在errno中 引數 mode 說明 r read,已唯讀方式開啟檔案,檔案必須存在 w writ...