要以讀檔案的模式開啟乙個檔案物件,使用python內建的open()
函式,傳入檔名和標示符:
>>> f = open('/users/michael/test.txt', 'r')
標示符'r'表示讀。
如果檔案開啟成功,接下來,呼叫read()
方法可以一次讀取檔案的全部內容,python把內容讀到記憶體,用乙個str
物件表示:
>>> f.read()
'hello, world!'
最後一步是呼叫close()
方法關閉檔案。檔案使用完畢後必須關閉,因為檔案物件會占用作業系統的資源,並且作業系統同一時間能開啟的檔案數量也是有限的:
>>> f.close()
由於檔案讀寫時都有可能產生ioerror
,一旦出錯,後面的f.close()
就不會呼叫。所以,為了保證無論是否出錯都能正確地關閉檔案,我們可以使用try ... finally
來實現:
try:
f = open('/path/to/file', 'r')
print(f.read())
finally:
if f:
f.close()
但是每次都這麼寫實在太繁瑣,所以,python引入了with
語句來自動幫我們呼叫close()
方法:
with open('/path/to/file', 'r') as f:
print(f.read())
這和前面的try ... finally
是一樣的,但是**更佳簡潔,並且不必呼叫f.close()
方法。
b'\xff\xd8\xff\xe1\x00\x18exif\x00\x00...' # 十六進製制表示的位元組
>>> f = open('/users/michael/gbk.txt', 'r', encoding='gbk')
>>> f.read()
'測試'
遇到有些編碼不規範的檔案,你可能會遇到unicodedecodeerror
,因為在文字檔案中可能夾雜了一些非法編碼的字元。遇到這種情況,open()
函式還接收乙個errors
引數,表示如果遇到編碼錯誤後如何處理。最簡單的方式是直接忽略:
>>> f = open('/users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')
寫檔案和讀檔案是一樣的,唯一區別是呼叫open()
函式時,傳入識別符號'w'
或者'wb'
表示寫文字檔案或寫二進位制檔案:
>>> f = open('/users/michael/test.txt', 'w')
>>> f.write('hello, world!')
>>> f.close()
你可以反覆呼叫write()
來寫入檔案,但是務必要呼叫f.close()
來關閉檔案。當我們寫檔案時,作業系統往往不會立刻把資料寫入磁碟,而是放到記憶體快取起來,空閒的時候再慢慢寫入。只有呼叫close()
方法時,作業系統才保證把沒有寫入的資料全部寫入磁碟。忘記呼叫close()
的後果是資料可能只寫了一部分到磁碟,剩下的丟失了。所以,還是用with
語句來得保險:
with open('/users/michael/test.txt', 'w') as f:
f.write('hello, world!')
要寫入特定編碼的文字檔案,請給open()
函式傳入encoding
引數,將字串自動轉換成指定編碼。
注意事項:
檔案路徑不能用反斜槓『\』。舉個例子,如果我傳入的檔案路徑是這樣的:
則會報錯syntaxerror: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: tr
原因分析:在windows系統當中讀取檔案路徑可以使用\,但是在python字串中\有轉義的含義,如\t可代表tab,\n代表換行,所以我們需要採取一些方式使得\不被解讀為轉義字元。目前有3個解決方案
1、在路徑前面加r,即保持字元原始值的意思。
2、替換為雙反斜槓
3、替換為正斜槓
open函式本質上,是先查詢路徑中是否有此檔案,如果有的話,直接開啟。
如果沒有的話,建立乙個檔案,再開啟(所以可以用open函式在指定路徑中建立乙個檔案)
開啟模式:
'r' (預設) 以唯讀模式開啟
'w' 以寫入模式開啟(寫入的內容會覆蓋已存在的檔案內容)
'x' 如果檔案已存在,會出現乙個錯誤:fileexistserror
'a' 以寫入模式開啟,把寫入的內容追加到末尾
'b' 以二進位制模式開啟
't' (預設)以文字模式開啟
'+' 可讀寫模式(可與其他模式一起使用)
'u' 支援通用換行符
檔案物件方法:
f.close()
f.read(size = -1) 預設為 -1 ,當未給定,或者給定負值時讀取所有字元
f.readline()
f.write(str) 僅支援以寫入模式開啟的檔案
f.weitelines(seq) seq為字串行,且是乙個返回字串的可迭代物件
f.seek(offset,from) 指標,從from偏移offset個位元組 (from=0代表起始位置,1代表當前位置,2代表檔案末尾)
f.tell() 返回當前位置
Python學習筆記(1)
在工作的業餘時間學習了一下python,個人覺得如果有下liunx下工作的習慣話,寫一些小的python指令碼很容易提高工作效率,以下主要是針對python與c 的區別而寫的一些學習筆記,共同溝通一起進步。1 python中不用 表示語句塊,而是用 來表示乙個塊的開始,而用縮進來表示各個語句塊之間的...
Python 學習筆記 1
2.讀了 python簡明教程 前面5章內容,很久之前看過一遍,現在是重溫,加做練習。教程是python v2.x,許多地方都不一樣了 help,print,exit 需要以函式的標準形式來替換,help print exit 之前的 raw input 被去掉,統一作input 3.python ...
python學習筆記(1 )
1 在確定自己不會匯入多個同名函式 從不同的模組匯入 的情況下,可以使用 from math import sqrt from 模組 import 函式 這樣就可以直接使用sqrt 9 而不用每次都用math.sqrt 9 2 可以使用變數來引用函式 及python中的大多數物件 如 import ...