資料描述
檢視資料型別
df.dtypes
檢視資料表前幾行(預設前五行)
df.head() # 檢視資料表前5行
df.head(3) # 檢視資料表前3行
檢視資料後幾行(預設後五行)
df.tail() # 檢視資料表後5行
df.tail(3) # 檢視資料表後3行
檢視行索引
df.index
檢視列索引
df.columns
資料統計方法描述(求和、均值、方差、最值)
df.describe()
資料定位
查詢一列,直接使用該列的索引
df['column'] # 只能檢視一列
下標區間查詢行
df[0:1] # 查詢第1行,左閉右開區間
索引區間查詢行
df['index1':'index2'] # 左閉右閉區間
loc 索引切片查詢資料
df.loc['index'] # 查詢索引為index的行
df.loc[:,:] # 查詢全部資料
df.loc['index',['column1','column2']] # 查詢一行兩列
df.loc['index','column'] # 查詢指定索引的值
iloc 下標切片查詢資料
df.iloc[0] # 查詢第一行資料
df.iloc[0:2,0:2] # 查詢兩行兩列資料
df.iloc[[1,2,4],[0,2]] # 查詢三行兩列資料
df.iloc[1,1] # 查詢特定值
isin 返回第column列滿足特定值的行
df.[df['column'].isin(['value1','value2'])]
預設值常見處理方法
檢視預設值
pd.isna(df) # 判斷資料是否存在預設值,預設返回true
刪除預設值
df.dropna() # 刪除含有預設值的行(預設)
df.dropna(axis=1) # 刪除含有預設值的列(axis=1列,axis=0行)
df.dropna(how='all') # 刪除全部為預設值的行
填充預設值
df.fillna(0) # 常數0填充全部預設值
df.fillna() # 字典格式填充,第一列填充value1,第二列填充value2,第三列填充value3
df.fillna(0,inplace = true) # 直接在原資料中修改
常見數學統計方法
均值
df.mean() # 查詢每列的均值
df.mean(1) # 查詢每行的均值
資料合併
方法一:concat()
特點:(1)根據資料表的index或column進行合併。上下拼接時,相同的column會合併;左右拼接時,相同的index會合併。
(2)可同時合併多張表。
(3)只能控制索引進行合併,不能控制相同資料部分合併。
(4)axis引數:axis=0,預設上下拼接;axis=1,左右拼接。
(5)join引數:join=「outer」,缺省外連線;join=「inner」,內連線取資料表相同的index或column。
pd.concat([df1,df2]) # 預設上下外連線合併
pd.concat([df1,df2],axis = 1) # 左右外連線合併
pd.concat([df1,df2],join = "inner") # 上下內連線合併
pd.concat([df1,df2],axis = 1,join = "inner") # 左右內連線合併
方法二:merge()
特點:(1)不同於concat只能按照index或column合併,merge合併更像資料庫表的拼接,根據兩張表中相同的key進行左右拼接。
(2)on引數:on=「key」,兩張表根據key進行合併。
(3)how引數:how=「inner」,缺省內連線,取交集;how=「outer」,外連線;how=「left」,左連線;how=「right」,右連線。
(4)left_on,right_on引數:設定左右兩張表拼接的key。
(5)left_index,right_index引數:left_index=true,索引連線,左表取索引為key。
pd.merge(df1,df2,on="key") # 根據相同的key進行合併
pd.merge(df1,df2,left_on="key1",right_on="key2") # 左表取key1為關鍵字,右表取key2為關鍵字
pd.merge(df1,df2,on="key",how="outer") # 外連線
##### 方法三:join()
待補充…
檔案操作
讀取csv檔案
pd.read_csv('檔名')
匯出csv檔案
df.to_csv('檔名')
Pandas常用功能 自用
df.to csv 希臘債務.csv index none encoding utf 8 sig sep t head list 天數 性別 身高 失蹤地點 失蹤年 失蹤月 到達地 df dealed pd.dataframe dealed list,columns head list 新增行名 d...
pandas常用方法
import pandas as pd import numpy as np import matplotlib.pyplot as plt import datetime import redf pd.read csv path file.csv 引數 header none 用預設列名,0,1,...
pandas 常用方法
import pandas as pd pd.read csv filename,encoding utf 8 讀取csv pd.to csv filename 儲存檔案,filename為檔案路徑,可以是相對路徑or絕對路徑 pd.to csv filename,index 0 儲存到檔案時,不要...