將資料新增到指定列 pandas資料載入

2021-10-14 20:09:06 字數 3161 閱讀 6765

使用read_csv將csv格式的檔案讀入

測試檔案demo.csv的內容:

引數:filepath_or_buffer:

字串,或者任何物件的read()方法。這個字串可以是url,有效的url方案包括http、ftp、s3和檔案。可以直接寫入"檔名.csv"

header:

將行號用作列名,且是資料的開頭。

注意當skip_blank_lines=true時,這個引數忽略注釋行和空行。所以header=0表示第一行是資料而不是檔案的第一行。

(1)、header=none

即指定原始檔案資料沒有列索引,這樣read_csv為其自動加上列索引

>>> df=pd.read_csv("demo.csv",header=none)>>> print(df)    0   1   2   30  c1  c2  c3  c41   a   0   5  102   b   1   6  113   c   2   7  124   d   3   8  135   e   4   9  14
(2)、header=none,並指定新的索引的名字names=seq序列

>>> df=pd.read_csv("demo.csv",header=none,names=range(2,6))>>> print(df)    2   3   4   50  c1  c2  c3  c41   a   0   5  102   b   1   6  113   c   2   7  124   d   3   8  135   e   4   9  14
(3)、header=none,並指定新的索引的名字names=seq序列;如果指定的新的索引名字的序列比原csv檔案的列數少,那麼就擷取原csv檔案的倒數列新增上新的索引名字

>>> df=pd.read_csv("demo.csv",header=0,names=range(2,4))>>> print(df)        2   3c1 c2  c3  c4a  0    5  10b  1    6  11c  2    7  12d  3    8  13e  4    9  14
(4)、header=0

表示檔案第0行(即第一行,索引從0開始)為列索引

>>> df=pd.read_csv("demo.csv",header=0)>>> print(df)  c1  c2  c3  c40  a   0   5  101  b   1   6  112  c   2   7  123  d   3   8  134  e   4   9  14
(5)、header=0,並指定新的索引的名字names=seq序列

>>> df=pd.read_csv("demo.csv",header=0,names=range(2,6))>>> print(df)   2  3  4   50  a  0  5  101  b  1  6  112  c  2  7  123  d  3  8  134  e  4  9  14
注:這裡是把原csv檔案的第一行換成了range(2,6)並將此作為列索引

(6)、header=0,並指定新的索引的名字names=seq序列;如果指定的新的索引名字的序列比原csv檔案的列數少,那麼就擷取原csv檔案的倒數列新增上新的索引名字

>>> df=pd.read_csv("demo.csv",header=0,names=range(2,4))>>> print(df)     2   3a 0  5  10b 1  6  11c 2  7  12d 3  8  13e 4  9  14
parse_dates:

布林型別值 or int型別值的列表 or 列表的列表 or 字典(預設值為 false)

(1)true:嘗試解析索引

(2)由int型別值組成的列表(如[1,2,3]):作為單獨資料列,分別解析原始檔案中的1,2,3列

(3)由列表組成的列表(如[[1,3]]):將1,3列合併,作為乙個單列進行解析

(4)字典(如):解析1,3列作為資料,並命名為foo

index_col:

int型別值,序列,false(預設 none)

將真實的某列當做index(列的數目,甚至列名)

index_col為指定資料中那一列作為dataframe的行索引,也可以可指定多列,形成層次索引,預設為none,即不指定行索引,這樣系統會自動加上行索引。

舉例:

>>> df=pd.read_csv("demo.csv",index_col=0)>>> print(df)    c2  c3  c4c1            a    0   5  10b    1   6  11c    2   7  12d    3   8  13e    4   9  14
表示:將第一列作為索引index

>>> df=pd.read_csv("demo.csv",index_col=1)>>> print(df)   c1  c3  c4c2           0   a   5  101   b   6  112   c   7  123   d   8  134   e   9  14
表示:將第二列作為索引index

>>> df=pd.read_csv("demo.csv",index_col="c1")>>> print(df)    c2  c3  c4c1            a    0   5  10b    1   6  11c    2   7  12d    3   8  13e    4   9  14
表示:將列名"c1"這裡一列作為索引index

【注】:這裡將"c1"這一列作為索引即行索引後,"c1"這列即不在屬於列名這類,即不能使用df['c1']獲取列值

【注】:read_csv()方法中header引數和index_col引數不能混用,因為header指定列索引,index_col指定行索引,乙個dataframe物件只有一種索引

squeeze:

布林值,預設false

true 如果被解析的資料只有一列,那麼返回series型別。

將資料集新增到listView中

以下方法 只要提供乙個資料集dataset,即可實現使用listview顯示資料 region 將資料集新增到listview中 public void filllist listview listview1,dataset ds 迴圈每一行 for int i 0 i rowcount i 將整理...

mysql兩列相加減將數值新增到新列

對於mysql中某錶選取兩列進行加減法,並將得到的結果輸出到新的列中 僅使用select只能查詢,本方法可以將得出的資料匯出 步驟一 新建列c alter table 表名 add column新列名double default null comment 注意新列名要加 步驟二 為c賦值 updat...

linux將程式新增到服務

方式 1 如果通過yum安裝的服務,直接敲入下面的命令就可以了開機時自動啟動服務了 方式 2編寫自己的服務指令碼 系統預定義函式 start stop restart reload 告訴程式重讀配置檔案,改變程式的執行狀態 etc rc.d init.d 系統服務指令碼目錄 var lock sub...