1.pandas讀取csv檔案,並選擇資料行,資料列,單個及多個資料
csv檔案
c:\users\10907\documents\training\days\csv檔案操作\test.csv
'def
pandas_csv(csv_path):
#df = pd.read_csv(csv_path,sep=';',encoding='utf-8',parse_dates=['purchase date'],dayfirst=true,index_col='purchase date')
#sep 將列分隔符改成;
#parse_dates 日期解析
#dayfirst 將天放在# index_col 將索引設定為日期列
df = pd.read_csv(csv_path,parse_dates=['
purchase date'])
bef_3line = df[:3] #
讀取前3行,切片
#print(bef_3line)
row = df['
cost
'] #
選擇一列
#print(row)
row_line = df['
cost
'][:5] #
選擇cost列前5行資料
#print(row_line)
more_row = df[['
cost
','part number
']] #
選擇多列資料
more_row = df[['
cost
','part number
']][:3] #
選擇多列前3行資料
#print(more_row)
row_count = df['
invoice number
'].value_counts() #
將列中的重複值進行分類彙總
#print(row_count)
top3 = row_count[:4] #
重複值最多的前3個
#print(top3)
namex = df[df['
supplier name
'] == '
supplier y
'] #
選擇supplier name列,值等於supplier x的行
#print(namex)
#print(namex[:2]) # 前兩行
name = df['
supplier name
'] == '
supplier y'#
符合條件的資料是true,不符合的是false
pnum = df['
part number
'] == 6650 #
符合條件的資料是true,不符合的是false
data_and = df[name & pnum] #
supplier name列值是y和part number列值為6650的行
#data_and = df[name & pnum][:2] # 顯示滿足以上條件的前2行
#print(data_and)
res = df[name & pnum][['
supplier name
','part number
','cost
','purchase date
']][:2] #
根據以上結果選擇想要顯示的列
#print(res)
#print(df.loc[6]) # 選擇第6行資料
#print(df.loc[0:2]) # 選擇1-2行資料
#print(df.loc[:,['invoice number','part number']]) # 選擇2列資料
#print(df.loc[0:2,['invoice number','part number']]) # 選擇第1行到第3行,invoice part兩列資料,索引22從0開始
print(df.loc[2,['
invoice number
','part number
']]) # 選擇第3行,invoice,part兩列資料
#print(df[df['purchase date'] == '2002-03-14']) # 選擇日期是2002-03-14的列
#print(df.head(2)) #檢視前2行
#print(df.tail(3)) # 後3行
#print(df.index) # 檢視索引
#print(df.columns) # 檢視所有列名,列標題
#print(df.values) # 檢視所有值,資料結構為列表巢狀
#print(df.describe()) # 快速統計彙總
#print(df.t) # 索引與列標題轉換
#print(df.sort_index(axis=1,ascending=false)) # 按軸進行排序
#print(df.sort_values(by='part number')) #按值進行排序
if__name__ == '
__main__':
pandas_csv(csv_path)
Pandas介紹 使用
一 介紹 資料處理工具 1 便捷的資料處理。2 讀取檔案方便 3 整合了 numpy 和 matplotlib的 計算跟畫圖。二 核心資料結構 1 dataframe 結構 既有行索引,又有列索引的二維陣列 pd.dataframe stock change,index stock,columns ...
pandas部分函式簡單介紹
在對資料做預處理的時候用到了pandas,整理一些用到的函式,以後檢視方便。初次使用給我的感覺就是pandas是用來處理 資料的乙個工具包,尤其是對csv格式的資料。它基於dataframe和series兩種資料型別。1.資料讀入 假設被讀取的文字名為train labels 100.csv內容如下...
Pandas的簡單使用
之前數學建模的時候處理了3天的資料,也是那次第一次正式使用pands,但是到今天我寫這篇部落格又過了1個月的時間,現在又對pandas有了新的認識,所以說 還是要多寫多練。其實具體來說也不是寫的很深,由於本人比較懶,還是先寫一些放在這,方便以後我使用,其實我之前有習慣就是把自己要記錄下來的東西寫下來...