pandas讀寫文字(csv)檔案

2021-10-10 13:13:46 字數 1851 閱讀 4550

csv檔案是一種純文字檔案,可以使用任何文字編輯器進行編輯,它支援追加模式,節省記憶體開銷。因為csv檔案具有諸多的優點,所以在很多時候會將資料儲存到csv檔案中。

pandas中提供了read_csv()函式與to_csv()方法,分別用於讀取csv檔案和寫入csv檔案,關於他們的具體介紹如下:

1.通過to_csv()方法將資料寫入csv檔案

to_csv(path_or_buf=none,sep=『,』,na_rep=』』,float_format=none,columns=none,header=true,index=true,index_label=none,mode=『w』,encoding=none,compression=none,quoting=none,quotechar=』「」』,line_terminator=』\n』,chunksize=none,tuplesize_cols=none,date_format=none,doublequote=true,escapechar=none,decimal=』.』)

(1)path_or_buf:檔案路徑

(2)index:布林值,預設為true。如果為false,則將不會顯示索引

(3)sep:分隔符,預設用 " . " 隔開

如果指定的路徑下檔案不存在,則會建立乙個檔案來儲存資料;如果檔案已經存在,則會將檔案中的內容進行覆蓋。
接下來,通過一段**來演示將dataframe物件中的資料寫入到csv檔案中:

2.通過read_csv()函式讀取csv檔案的資料;read_csv()函式的作用是將csv檔案的資料讀取出來,並轉換成dataframe物件。read_csv()函式的語法:read_csv(filepath_or_buffer,sep=",",delimiter=none,header=「infer」,names=none,index_col=none,usecols=none,squeeze=false,perfix=none,mangle_dupe_cols=true,dtype=none…)

上述函式中常用引數表示的含義如下:

(1)filepath_or_buffer:表示檔案路徑,可以為url字串

(2)sep:分隔符,預設用 " ," 隔開

(3)header:指定行數用來作為列名,如果讀取的檔案中沒有列名,則預設為0,否則設定為none                 //指定的行數如果在中間行,上面的行不要,拿它下面的行作為資料,自己做為列名,反正處於它下面的才會要

(4)names:用於結果的列名列表。如果檔案不包含標題行,則應該將該引數設定為none

(5)index_col:用作行索引的列編號或者列名,如果給定乙個序列,則表示有多個行索引             //index_col=多少,就把那一列作為索引列,比如index_col=1,把1作為索引列

接下來,使用read_csv()函式將檔案讀取出來:

#read_table()和 read_csv()的區別在於使用的分隔符不同,前面為",",後面為"\t"

header引數用法:

index_col引數的用法:

CSV檔案讀寫

delimiter 分隔符 quotechar 如果某個item中包含了分隔符,用quotechar包裹 doublequote quotechar double 一下用來做區分 escapechar 如果不用 doublequote 的方法還可以用 escapechar 來輔助 linetermi...

CSV 檔案讀寫

乙個臨時的任務,需要把乙個有幾百萬條記錄的 csv 檔案分割成多個小一點的檔案,沒找到合適的分割工具,就花了一點時間研究了 csv 檔案的讀寫操作。成果如下 public static arraylistreadcsvbycsvreader string filepath reader.close ...

Pandas操作CSV檔案的讀寫實現方法

1 導庫 import pandas as pd from程式設計客棧 pandas import series 2 讀取csv檔案的兩種方式 讀取csv檔案的兩種方式 f open e 建模 第5周 data ex1.csv 方法一 df pd.read csv f print df f.clos...