讀寫csv檔案
寫入 df.to_csv(filename)
讀取 pd.read_csv(filename,header=0) #保留列屬性,header=none不讀列屬性
缺失值處理
去掉包含缺失值的行
df.dropna(how=』any』)
對缺失值進行填充
df.fillna(value=5)
選擇行或列
df.iloc[3] #第四行
df.iloc[:,3] #第四列
df.iloc[3:5,0:2] #第四到六行,第一到三列
df.iloc[[4,5,6],[0,1,2]] #第四到六行,第一到三列
df #這是對行進行切片
統計df.describe() #描述
df.head() #頭五行
df.tail() #尾五行
df.t #轉置
df.sort(columns=』b』)# 對軸進行排序
df.mean() #對每列求均值 通過axis=0/1 確定行列
對映pd.concat(list) #list各元素為各個dateframe
例如 pieces = [df[:3],df[3:6],df[6]];pd.concat(pieces)
原文:
pandas 常用函式
本文翻譯自文章 pandas cheat sheet python for data science 同時新增了部分註解。對於資料科學家,無論是資料分析還是資料探勘來說,pandas是乙個非常重要的python包。它不僅提供了很多方法,使得資料處理非常簡單,同時在資料處理速度上也做了很多優化,使得和...
Pandas常用函式
count 非 na 值的數量 describe 針對 series 或 df 的列計算匯 計 min max 最小值和最大值 argmin argmax 最小值和最大值的索引位置 整數 idxmin idxmax 最小值和最大值的索引值 quantile 樣本分位數 0 到 1 sum求和 mea...
pandas常用函式
pd.read csv filename 從csv檔案匯入資料 pd.read table filename 從限定分隔符的文字檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫...