檔案太大,記憶體不足時的讀取問題

2022-08-23 18:21:13 字數 750 閱讀 7449

#
現在考慮有乙個 jsonline 格式的檔案 file.txt 大小約為 10k,之前處理檔案的

**如下所示:

1. def

get_lines():

2.   l =

3.   with open(『file.txt』,『rb』) as f:

4.     for eachline in

f:6.   return

l7. if

__name__ == 『__main__

』:8.   for e in

get_lines():

9.     process(e) #

處理每一行資料

#
現在要處理乙個大小為 10g 的檔案,但是記憶體只有 4g,如果在只修改 get_lines 函式而其他代

碼保持不變的情況下,應該如何實現?需要考慮的問題都有哪些?

1. def

get_lines():

2.   l =

3.   with open(『file.txt』,』rb』) as f:

4.     data = f.readlines(60000)

6.   yield l

說明 : 記憶體只有 4g 無法一次性讀入 10g 的檔案,需要分批讀入。分批讀入資料要記錄每次讀入資料的位

置。分批每次讀入資料的大小,太小就會在讀取操作上花費過多時間。

python分塊讀取大資料,避免記憶體不足的方法

如下所示 def read data file name file name 檔案位址 inputfile open file name,rb 可開啟含有中文的位址 data pd.read csv i iterator true loop true chunksize 1000 一千行一塊 chu...

oracle安裝過程中的記憶體不足問題

由於d盤沒有共享儲存,電腦沒有辦法檢測記憶體大小 解決辦法 開啟c盤的預設共享 開啟doc視窗,輸入net share c c 關閉c盤 的預設共 享 開啟 doc窗 口,輸入 nets hare c c 關閉c盤的預設共享 開啟doc視窗,輸入net share c c 關閉c 盤的預設 共享 打...

虛擬記憶體不足造成的藍屏 問題分析及解決

之前藍屏的問題一直在腦子裡面轉,沉下心來,踏實走一遍看看.1.虛擬記憶體檔案是什麼?起什麼作用?2.如何確定虛擬記憶體檔案的大小?3.如何設定虛擬記憶體檔案?首先來回答問題1 windows作業系統的記憶體管理是建立在虛擬記憶體的基礎上的.每個程序都有自己的私有虛擬位址空間。當接近低記憶體資源的條件...