讀寫檔案是最常見的io操作。
python內建了讀寫檔案的函式,用法和c是相容的。
讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件(通常稱為檔案描述符),然後,通過作業系統提供的介面從這個檔案物件中讀取資料(讀檔案),或者把資料寫入這個檔案物件(寫檔案)。
檔案i/o
讀寫檔案之前,先用open()函式開啟乙個檔案,它會返回乙個檔案物件(file object):
f = open(filename,mode)
原始碼:def open(file, mode='r', buffering=none, encoding=none, errors=none, newline=none, closefd=true)
mode型別預設為r,以下為所有型別:
'r' open for reading (default)
'w' open for writing, truncating the file first
'x' create a new file and open it for writing
'b' binary mode
't' text mode (default)
'+' open a disk file for updating (reading and writing)
'u' universal newline mode (deprecated)
目前主要使用以下型別:
r:唯讀
w:只寫,如果檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案
+:讀寫(不能單獨使用)
a:開啟檔案用於追加,只寫,不存在則建立新檔案
b:以二進位制模式開啟(不能單獨使用)
ps:目前只有w和a可以建立檔案
讀檔案要以讀檔案的模式開啟乙個檔案物件,使用python內建的open()函式,傳入檔名和標示符:
>>> f = open('帥就完事了.txt', 'r')
標示符'r'表示讀,這樣,我們就成功地開啟了乙個檔案。
如果檔案不存在,open()函式就會丟擲乙個ioerror的錯誤,並且給出錯誤碼和詳細的資訊告訴你檔案不存在
如果檔案開啟成功,接下來,呼叫read()方法可以一次讀取檔案的全部內容,python把內容讀到記憶體,用乙個str物件表示:
>>> f.read()
'hello, world!'
最後一步是呼叫close()方法關閉檔案。檔案使用完畢後必須關閉,因為檔案物件會占用作業系統的資源,並且作業系統同一時間能開啟的檔案數量也是有限的:
>>> f.close()
由於檔案讀寫時都有可能產生ioerror,一旦出錯,後面的f.close()就不會呼叫。所以,為了保證無論是否出錯都能正確地關閉檔案,我們可以使用try ... finally來實現:
try:
f = open('/path/to/file', 'r')
print(f.read())
finally:
if f:
f.close()
但是每次都這麼寫實在太繁瑣,所以,python引入了with語句來自動幫我們呼叫close()方法:
with open('/path/to/file', 'r') as f:
print(f.read())
這和前面的try ... finally是一樣的,但是**更佳簡潔,並且不必呼叫f.close()方法。
寫檔案》 f = open('/users/michael/test.txt', 'w')
>>> f.write('hello, world!')
>>> f.close()
你可以反覆呼叫write()來寫入檔案,但是務必要呼叫f.close()來關閉檔案。當我們寫檔案時,作業系統往往不會立刻把資料寫入磁碟,而是放到記憶體快取起來,空閒的時候再慢慢寫入。
file.flush()
重新整理檔案內部緩衝,直接把內部緩衝區的資料立刻寫入檔案, 而不是被動的等待輸出緩衝區寫入。
只有呼叫close()方法時,作業系統才保證把沒有寫入的資料全部寫入磁碟。忘記呼叫close()的後果是資料可能只寫了一部分到磁碟,剩下的丟失了。所以,還是用with語句來得保險:
with open('/users/michael/test.txt', 'w') as f:
f.write('hello, world!')
要寫入特定編碼的文字檔案,請給open()函式傳入encoding引數,將字串自動轉換成指定編碼。
檔案物件的方法
file.chardet()方法:用於判斷編碼格式
file.flush()方法:用於重新整理緩衝區的,即將緩衝區中的資料立刻寫入檔案,同時清空緩衝區,不需要是被動的等待輸出緩衝區寫入。
file.seek()方法:設定檔案當前游標位置
file.read([size])方法:size為空,全部讀取。
file.fileno()方法:返回乙個整型的檔案描述符(file descriptor fd 整型), 可以用在如os模組的read方法等一些底層操作上。
file.readline([size])方法:讀取整行,包括 "\n" 字元。
file.tell()方法:返回檔案當前位置。
file.truncate([size])方法:方法用於從檔案的首行首字元開始截斷,截斷檔案為 size 個字元,無 size 表示從當前位置截斷;
截斷之後 v 後面的所有字元被刪除,其中 widnows 系統下的換行代表2個字元大小。
file.write(str)方法:將字串寫入檔案,沒有返回值。
用Python處理csv檔案
csv 是 逗號分隔值 的英文縮寫,通常都是純文字檔案。建議使用 wordpad 或是記事本 note 來開啟,再則先另存新檔後用 excel 開啟,也是方法之一。一直以為 csv 是某種 excel 檔案,原來是一種純文字檔案,嘗試用記事本開啟乙個 csv 檔案 果然,在記事本中是以逗號為分隔符,...
用goto做異常處理
今天在csdn上看到的關於錯誤返回值的討論,感覺非常有趣。從中可以看出被教化的孩子與大神之間的區別.討論如下 先放上提問者的源程式 這是第一種,做出判斷後,如果條件出錯,直接return.1 int mystrlen char str 2 8 9 if str 0 10 13 14 while st...
用goto做異常處理
今天在csdn上看到的關於錯誤返回值的討論,感覺非常有趣。從中可以看出被教化的孩子與大神之間的區別.討論如下 先放上提問者的源程式 這是第一種,做出判斷後,如果條件出錯,直接return.1 int mystrlen char str 2 89if str 0 10 1314while str 0 ...