pandas簡單使用介紹

2022-10-06 10:33:17 字數 2920 閱讀 6523

1.pandas讀取csv檔案,並選擇資料行,資料列,單個及多個資料

csv檔案

c:\users\10907\documents\training\days\csv檔案操作\test.csv

'def

pandas_csv(csv_path):

#df = pd.read_csv(csv_path,sep=';',encoding='utf-8',parse_dates=['purchase date'],dayfirst=true,index_col='purchase date')

#sep 將列分隔符改成;

#parse_dates 日期解析

#dayfirst 將天放在# index_col 將索引設定為日期列

df = pd.read_csv(csv_path,parse_dates=['

purchase date'])

bef_3line = df[:3] #

讀取前3行,切片

#print(bef_3line)

row = df['

cost

'] #

選擇一列

#print(row)

row_line = df['

cost

'][:5] #

選擇cost列前5行資料

#print(row_line)

more_row = df[['

cost

','part number

']] #

選擇多列資料

more_row = df[['

cost

','part number

']][:3] #

選擇多列前3行資料

#print(more_row)

row_count = df['

invoice number

'].value_counts() #

將列中的重複值進行分類彙總

#print(row_count)

top3 = row_count[:4] #

重複值最多的前3個

#print(top3)

namex = df[df['

supplier name

'] == '

supplier y

'] #

選擇supplier name列,值等於supplier x的行

#print(namex)

#print(namex[:2]) # 前兩行

name = df['

supplier name

'] == '

supplier y'#

符合條件的資料是true,不符合的是false

pnum = df['

part number

'] == 6650 #

符合條件的資料是true,不符合的是false

data_and = df[name & pnum] #

supplier name列值是y和part number列值為6650的行

#data_and = df[name & pnum][:2] # 顯示滿足以上條件的前2行

#print(data_and)

res = df[name & pnum][['

supplier name

','part number

','cost

','purchase date

']][:2] #

根據以上結果選擇想要顯示的列

#print(res)

#print(df.loc[6]) # 選擇第6行資料

#print(df.loc[0:2]) # 選擇1-2行資料

#print(df.loc[:,['invoice number','part number']]) # 選擇2列資料

#print(df.loc[0:2,['invoice number','part number']]) # 選擇第1行到第3行,invoice part兩列資料,索引22從0開始

print(df.loc[2,['

invoice number

','part number

']]) # 選擇第3行,invoice,part兩列資料

#print(df[df['purchase date'] == '2002-03-14']) # 選擇日期是2002-03-14的列

#print(df.head(2)) #檢視前2行

#print(df.tail(3)) # 後3行

#print(df.index) # 檢視索引

#print(df.columns) # 檢視所有列名,列標題

#print(df.values) # 檢視所有值,資料結構為列表巢狀

#print(df.describe()) # 快速統計彙總

#print(df.t) # 索引與列標題轉換

#print(df.sort_index(axis=1,ascending=false)) # 按軸進行排序

#print(df.sort_values(by='part number')) #按值進行排序

if__name__ == '

__main__':

pandas_csv(csv_path)

Pandas介紹 使用

一 介紹 資料處理工具 1 便捷的資料處理。2 讀取檔案方便 3 整合了 numpy 和 matplotlib的 計算跟畫圖。二 核心資料結構 1 dataframe 結構 既有行索引,又有列索引的二維陣列 pd.dataframe stock change,index stock,columns ...

pandas部分函式簡單介紹

在對資料做預處理的時候用到了pandas,整理一些用到的函式,以後檢視方便。初次使用給我的感覺就是pandas是用來處理 資料的乙個工具包,尤其是對csv格式的資料。它基於dataframe和series兩種資料型別。1.資料讀入 假設被讀取的文字名為train labels 100.csv內容如下...

Pandas的簡單使用

之前數學建模的時候處理了3天的資料,也是那次第一次正式使用pands,但是到今天我寫這篇部落格又過了1個月的時間,現在又對pandas有了新的認識,所以說 還是要多寫多練。其實具體來說也不是寫的很深,由於本人比較懶,還是先寫一些放在這,方便以後我使用,其實我之前有習慣就是把自己要記錄下來的東西寫下來...