讀取
寫入read_csv
to_csv
read_excel
to_excel
read_hdf
to_hdf
read_sql
to_sql
read_json
to_json
read_msgpack (experimental)
to_msgpack (experimental)
read_html
to_html
read_gbq (experimental)
to_gbq (experimental)
read_stata
to_stata
read_sas
read_clipboard
to_clipboard
read_pickle
to_pickle//速度比csv快
方法作用
count
非 na 值的數量
describe
針對 series 或 df 的列計算匯**計
min , max
最小值和最大值
argmin , argmax
最小值和最大值的索引位置(整數)
idxmin , idxmax
最小值和最大值的索引值
quantile
樣本分位數(0 到 1)
sum求和
mean
均值median
中位數mad
根據均值計算平均絕對離差
var方差
std標準差
skew
樣本值的偏度(三階矩)
kurt
樣本值的峰度(四階矩)
cumsum
樣本值的累計和
cummin , cummax
樣本值的累計最大值和累計最小值
cumprod
樣本值的累計積
diff
計算一階差分(對時間序列很有用)
pct_change
計算百分數變化
pandas常用方法
import pandas as pd import numpy as np import matplotlib.pyplot as plt import datetime import redf pd.read csv path file.csv 引數 header none 用預設列名,0,1,...
pandas 常用方法
import pandas as pd pd.read csv filename,encoding utf 8 讀取csv pd.to csv filename 儲存檔案,filename為檔案路徑,可以是相對路徑or絕對路徑 pd.to csv filename,index 0 儲存到檔案時,不要...
Pandas中常用的方法
為資料分配索引,例如 data np.random randn 5 pd.series data,index a b c d e a 0.287461 b 0.736157 c 1.759875 d 0.238167 e 0.621458 dtype float64pd.series np.rand...