Pandas常用的方法

2021-09-27 21:59:46 字數 1048 閱讀 1626

讀取

寫入read_csv

to_csv

read_excel

to_excel

read_hdf

to_hdf

read_sql

to_sql

read_json

to_json

read_msgpack (experimental)

to_msgpack (experimental)

read_html

to_html

read_gbq (experimental)

to_gbq (experimental)

read_stata

to_stata

read_sas

read_clipboard

to_clipboard

read_pickle

to_pickle//速度比csv快

方法作用

count

非 na 值的數量

describe

針對 series 或 df 的列計算匯**計

min , max

最小值和最大值

argmin , argmax

最小值和最大值的索引位置(整數)

idxmin , idxmax

最小值和最大值的索引值

quantile

樣本分位數(0 到 1)

sum求和

mean

均值median

中位數mad

根據均值計算平均絕對離差

var方差

std標準差

skew

樣本值的偏度(三階矩)

kurt

樣本值的峰度(四階矩)

cumsum

樣本值的累計和

cummin , cummax

樣本值的累計最大值和累計最小值

cumprod

樣本值的累計積

diff

計算一階差分(對時間序列很有用)

pct_change

計算百分數變化

pandas常用方法

import pandas as pd import numpy as np import matplotlib.pyplot as plt import datetime import redf pd.read csv path file.csv 引數 header none 用預設列名,0,1,...

pandas 常用方法

import pandas as pd pd.read csv filename,encoding utf 8 讀取csv pd.to csv filename 儲存檔案,filename為檔案路徑,可以是相對路徑or絕對路徑 pd.to csv filename,index 0 儲存到檔案時,不要...

Pandas中常用的方法

為資料分配索引,例如 data np.random randn 5 pd.series data,index a b c d e a 0.287461 b 0.736157 c 1.759875 d 0.238167 e 0.621458 dtype float64pd.series np.rand...