讀寫檔案是最常見的io操作。python內建了讀寫檔案的函式。
讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統完成的,現代作業系統不允許普通的程式直接對磁碟進行操作,所以,
讀寫檔案就是請求作業系統開啟乙個檔案物件通常稱為檔案描述符,然後,通過作業系統提供的藉口從這個檔案中讀取資料,或者把資料寫入這個檔案物件
讀檔案:
>>> f = open('/users/michael/test.txt
', '
r')
標示符'r'表示讀,這樣,我們就成功地開啟了乙個檔案。
如果檔案不存在,open()
函式就會丟擲乙個ioerror
的錯誤,並且給出錯誤碼和詳細的資訊告訴你檔案不存在:
如果檔案開啟成功,接下來,呼叫read()
方法可以一次讀取檔案的全部內容,python把內容讀到記憶體,用乙個str
物件表示:
>>>f.read()'hello, world!
'
最後一步是呼叫close()
方法關閉檔案。檔案使用完畢後必須關閉,因為檔案物件會占用作業系統的資源,並且作業系統同一時間能開啟的檔案數量也是有限的:
try: f = open('
/path/to/file
', 'r'
)
(f.read())
finally
:
iff:
f.close()
但是每次都這麼寫實在太繁瑣,所以,python引入了with
語句來自動幫我們呼叫close()
方法:
with open('/path/to/file
', 'r'
) as f:
print(f.read())
這和前面的try ... finally
是一樣的,但是**更佳簡潔,並且不必呼叫f.close()
方法。
呼叫read()
會一次性讀取檔案的全部內容,如果檔案有10g,記憶體就爆了,所以,要保險起見,可以反覆呼叫read(size)
方法,每次最多讀取size個位元組的內容。另外,呼叫readline()
可以每次讀取一行內容,呼叫readlines()
一次讀取所有內容並按行返回list
。因此,要根據需要決定怎麼呼叫。
如果檔案很小,read()
一次性讀取最方便;如果不能確定檔案大小,反覆呼叫read(size)
比較保險;如果是配置檔案,呼叫readlines()
最方便:
如果檔案很小,read()
一次性讀取最方便;如果不能確定檔案大小,反覆呼叫read(size)
比較保險;如果是配置檔案,呼叫readlines()
最方便:
for line inf.readlines():
print(line.strip()) #
把末尾的'\n'刪掉
像open()
函式返回的這種有個read()
方法的物件,在python中統稱為file-like object。除了file外,還可以是記憶體的位元組流,網路流,自定義流等等。file-like object不要求從特定類繼承,只要寫個read()
方法就行。
stringio
就是在記憶體中建立的file-like object,常用作臨時緩衝。
十六進製制表示的位元組
>>> f = open('/users/michael/gbk.txt
', '
r', encoding='
gbk'
)>>>f.read()'測試
'
遇到有些編碼不規範的檔案,你可能會遇到unicodedecodeerror
,因為在文字檔案中可能夾雜了一些非法編碼的字元。遇到這種情況,open()
函式還接收乙個errors
引數,表示如果遇到編碼錯誤後如何處理。最簡單的方式是直接忽略:
>>> f = open('/users/michael/gbk.txt
', '
r', encoding='
gbk', errors='
ignore
')
寫檔案和讀檔案是一樣的,唯一區別是呼叫open()
函式時,傳入識別符號'w'
或者'wb'
表示寫文字檔案或寫二進位制檔案:
你可以反覆呼叫write()
來寫入檔案,但是務必要呼叫f.close()
來關閉檔案。當我們寫檔案時,作業系統往往不會立刻把資料寫入磁碟,而是放到記憶體快取起來,空閒的時候再慢慢寫入。只有呼叫close()
方法時,作業系統才保證把沒有寫入的資料全部寫入磁碟。忘記呼叫close()
的後果是資料可能只寫了一部分到磁碟,剩下的丟失了。所以,還是用with
語句來得保險:
要寫入特定編碼的文字檔案,請給open()
函式傳入encoding
引數,將字串自動轉換成指定編碼。
python學習筆記 CSV檔案讀
python pandas io tools 之csv檔案讀寫 讀取csv檔案 pd.read csv 寫入csv檔案 pd.to csv import pandas as pd obj pd.read csv test.csv print objunnamed 0 c1 c2 c3 0 a 0 5...
python非同步io讀檔案 python之非同步IO
我們知道,cpu的速度遠遠快於磁碟 網路等io。在乙個執行緒中,cpu執行 的速度極快,然而,一旦遇到io操作,如讀寫檔案 傳送網路資料時,就需要等待io操作完成,才能繼續進行下一步操作。這種情況稱為同步io。在io操作的過程中,當前執行緒被掛起,而其他需要cpu執行的 就無法被當前執行緒執行了。因...
Python學習筆記 IO程式設計 檔案讀寫
根據廖雪峰python教程整理 讀寫檔案是最常見的io 操作。python 內建了讀寫檔案的函式,用法和 c是相容的。讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件 通常稱為檔案描述...