io在計算機中指input/output,也就是輸入和輸出。由於程式和執行時資料是在記憶體中駐留,由cpu這個超快的計算核心來執行,涉及到資料交換的地方,通常是磁碟、網路等,就需要io介面。
只要進行資料交換,網路傳輸等行為都會產生io操作。
同步io:cpu等著,也就是程式暫停執行後續**,等100m的資料在10秒後寫入磁碟,再接著往下執行。
非同步io:cpu不等待,只是告訴磁碟,「您老慢慢寫,不著急,我接著幹別的事去了」,於是,後續**可以立刻接著執行。
同步和非同步的區別就在於是否等待io執行的結果。
檔案讀寫:
寫檔案是最常見的io操作。python內建了讀寫檔案的函式,用法和c是相容的。
讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件(通常稱為檔案描述符),
然後,通過作業系統提供的介面從這個檔案物件中讀取資料(讀檔案),或者把資料寫入這個檔案物件(寫檔案)。
要以讀檔案的模式開啟乙個檔案物件,使用python內建的open()
函式,傳入檔名和標示符:
如果檔案開啟成功,接下來,呼叫read()
方法可以一次讀取檔案的全部內容,python把內容讀到記憶體,用乙個str
物件表示:
最後一步是呼叫close()
方法關閉檔案。檔案使用完畢後必須關閉,因為檔案物件會占用作業系統的資源,並且作業系統同一時間能開啟的檔案數量也是有限的:
由於檔案讀寫時都有可能產生ioerror
,一旦出錯,後面的f.close()
就不會呼叫。所以,為了保證無論是否出錯都能正確地關閉檔案,我們可以使用try ... finally
來實現:
try:
f = open('c:', 'r')
print f.read()
finally:
if f:
f.close()
python引入了with
語句來自動幫我們呼叫close()
方法:
with open('c:', 'r') as f:
print f.read()
這和前面的try ... finally
是一樣的,但是**更佳簡潔,並且不必呼叫f.close()
方法。
呼叫read()
會一次性讀取檔案的全部內容,如果檔案有10g,記憶體就爆了,所以,要保險起見,可以反覆呼叫read(size)
方法,每次最多讀取size個位元組的內容。另外,呼叫readline()
可以每次讀取一行內容,呼叫readlines()
一次讀取所有內容並按行返回list
。因此,要根據需要決定怎麼呼叫。
如果檔案很小,read()
一次性讀取最方便;如果不能確定檔案大小,反覆呼叫read(size)
比較保險;如果是配置檔案,呼叫readlines()
最方便:
for line in f.readlines():
print(line.strip()) # 把末尾的'\n'刪掉
要讀取非ascii編碼的文字檔案,就必須以二進位制模式開啟,再解碼。比如gbk編碼的檔案
>>> f = open('/users/michael/gbk.txt', 'rb')
>>> u = f.read().decode('gbk')
>>> u
u'\u6d4b\u8bd5'
>>> print u
測試
寫檔案和讀檔案是一樣的,唯一區別是呼叫open()
函式時,傳入識別符號'w'
或者'wb'
表示寫文字檔案或寫二進位制檔案:
with open('/users/michael/test.txt', 'w') as f:
f.write('hello, world!')
檔案常見的讀寫模式
w 以寫方式開啟,
w 檔案若存在,首先要清空,然後(重新)建立
a 以追加模式開啟 (從 eof 開始, 必要時建立新檔案)
r+ 以讀寫模式開啟
w+ 以讀寫模式開啟 (參見 w )
a+ 以讀寫模式開啟 (參見 a )
rb 以二進位制讀模式開啟
wb 以二進位制寫模式開啟 (參見 w )
ab 以二進位制追加模式開啟 (參見 a )
rb+ 以二進位制讀寫模式開啟 (參見 r+ )
wb+ 以二進位制讀寫模式開啟 (參見 w+ )
ab+ 以二進位制讀寫模式開啟 (參見 a+ )
檔案開啟模式 w+ r+ a+ 區別和辨析
w+ 開啟檔案並讀寫:
1. 檔案存在,則清空(也即寫入空);
2. 檔案不存在,則建立檔案 ;
3. 檔案流定位到開始位置, 所以read() 會得到空。
r+ 開啟檔案並讀寫:
1. 檔案存在,開啟檔案,檔案指標定位到檔案開始位置;
2. 檔案不存在, 則報錯檔案不存在。
a+ 開啟檔案並讀寫:
1. 檔案存在,開啟檔案,檔案指標定位到檔案開始位置,但不清空;
2. 檔案不存在,建立檔案;
3. 開啟後讀取時,在檔案開頭位置,
4. 寫入時,新增到文章末尾,並且指標位於新增後的末尾,所以再次讀取會亂碼。
另外:1. w 開啟檔案寫入,也會清空檔案,如果使用read(),則報錯;a 開啟檔案新增,資料流新增到檔案末尾,而不是w模式的清空後,新增到檔案末尾。
2. b可以附加到上述的字母後,形成rb, rb+, wb等等模式,針對二進位制檔案,比如exe, elf, jpeg格式的檔案,進行檔案操作; 在unix 型別的系統上,text格式與二進位制的處理相同,
但是非unix型別的系統上,換行格式不同,所以需要用加b模式來在指定是否是二進位制。
python IO程式設計
io程式設計 檔案讀寫 f open text.txt r 標示符 r 表示讀 str f.read print str f.close 如果檔案不存在,open 函式就會丟擲乙個ioerror的錯誤,並且給出錯誤碼和詳細的資訊告訴你檔案不存在。最後一步是呼叫close 方法關閉檔案。檔案使用完畢後...
PythonIO程式設計
1.檔案讀寫 python內建了讀寫檔案的函式,用法和c是相容的。讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件 通常稱為檔案描述符 然後,通過作業系統提供的介面從這個檔案物件中讀取...
python IO程式設計
目錄stringio和bytesio 操作檔案和目錄 序列化在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件 通常稱為檔案描述符 然後,通過作業系統提供的介面從這個檔案物件中讀取資料 讀檔案 或者把資料寫入這個檔案物...