Pandas read csv讀取檔案函式詳解

2021-10-03 03:39:16 字數 1583 閱讀 6025

首先來了解一下官方給出的該函式用法

read_csv(filepath_or_buffer, sep=',', delimiter=none, header='infer', names=none, index_col=none, usecols=none, squeeze=false, prefix=none, mangle_dupe_cols=true, dtype=none, engine=none, converters=none, true_values=none, false_values=none, skipinitialspace=false, skiprows=none, nrows=none, na_values=none, keep_default_na=true, na_filter=true, verbose=false, skip_blank_lines=true, parse_dates=false, infer_datetime_format=false, keep_date_col=false, date_parser=none, dayfirst=false, iterator=false, chunksize=none, compression='infer', thousands=none, decimal=b'.', lineterminator=none, quotechar='"', quoting=0, escapechar=none, comment=none, encoding=none, dialect=none, tupleize_cols=none, error_bad_lines=true, warn_bad_lines=true, skipfooter=0, doublequote=true, delim_whitespace=false, low_memory=true, memory_map=false, float_precision=none)
但是我們日常用的話,也都了解,沒必要全部都用上,所以接下來就介紹一些引數,滿足我們日常所用。

【注】預設值是一種計算機術語(乙個屬性引數被修改前的初始值),指在無決策者干預情況下,對於決策或應用軟體電腦程式的系統引數的自動選擇。預設選項的設計可以在使用者不須決策的狀況下就可以基礎地使用上述的軟體與程式。

【注】

na:缺失資料

nan:無意義的數,比如sqrt(-2), 0/0。

inf:正無窮大

-inf:負無窮大

null:不存在

#ind:來自於任何未定義結果(非法)的浮點數運算。

"ind"是 indeterminate(不確定) 的縮寫,而"nan"是 not a number 的縮寫。

ind表示nan, 比如 0/0 log( -1 ) 等等。

ind是windows上的說法,nan是linux上的說法,含義是一樣的。

qnan的意思是:quiet not a number,也就是不會觸發浮點異常的nan,而nan是「不是乙個數」的意思。這一般說明你的數字超過了float的表示範圍,比如用乙個很大的數除很小的數,或者除0錯誤。

##摘抄自網路

部分參考自:

C 讀取 讀取XML

讀取xml到listbox combobox 1,知識需求 1 訪問xml檔案的兩個基本模型 一,dom模型 使用dom的好處在於它允許編輯和更新xml文件,可以隨機訪問文件中的資料,可以使用xpath查詢,但是,dom的缺點在於它需要一次性的載入整個文件到記憶體中,對於大型的文件,這會造成資源問題...

讀取excel PySpark讀取Excel

日常工作中,客戶通過excel提供資料是一種很常見的方式,既然碰到了就得解決。我常用的辦法就是pandas讀取,並儲存為parquet,如果只讀取乙個sheet,import pandas as pddf pd.read excel excel1.xlsx df.to parquet excel e...

中讀取資料 讀取資料

對資料庫有一定了解的同學應該都知道資料表這個東西。資料表一般是以行列來儲存和展示資料的。每一列就是乙個資料字段,代表每一行資料的屬性。在python裡面也有類似表概念的東西,叫做dataframe。dataframe是我們資料分析和風控建模中很重要乙個元素,後續的很多資料操作都要以此為基礎。我們的資...