pandas 常用函式

2021-08-03 01:20:03 字數 678 閱讀 4050

本文翻譯自文章: 

pandas cheat sheet - python for data science

,同時新增了部分註解。

對於資料科學家,無論是資料分析還是資料探勘來說,pandas是乙個非常重要的python包。它不僅提供了很多方法,使得資料處理非常簡單,同時在資料處理速度上也做了很多優化,使得和python內建方法相比時有了很大的優勢。

如果你想學習pandas,建議先看兩個**。

(1)官網: python data analysis library

(2)十分鐘入門pandas: 10 minutes to pandas

在第一次學習pandas的過程中,你會發現你需要記憶很多的函式和方法。所以在這裡我們彙總一下 pandas官方文件 中比較常用的函式和方法,以方便大家記憶。同時,我們提供乙個pdf版本,方便大家列印。 pandas-cheat-sheet.pdf

在這個速查手冊中,我們使用如下縮寫:

df:任意的pandas dataframe物件

同時我們需要做如下的引入:

import pandas as pd

df.concat([df1, df2],axis=1):將df2中的列新增到df1的尾部

df1.join(df2,on=col1,how='inner'):對df1的列和df2的列執行sql形式的join

Pandas常用函式

count 非 na 值的數量 describe 針對 series 或 df 的列計算匯 計 min max 最小值和最大值 argmin argmax 最小值和最大值的索引位置 整數 idxmin idxmax 最小值和最大值的索引值 quantile 樣本分位數 0 到 1 sum求和 mea...

pandas常用函式

pd.read csv filename 從csv檔案匯入資料 pd.read table filename 從限定分隔符的文字檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫...

pandas 常用函式

讀寫csv檔案 寫入 df.to csv filename 讀取 pd.read csv filename,header 0 保留列屬性,header none不讀列屬性 缺失值處理 去掉包含缺失值的行 df.dropna how any 對缺失值進行填充 df.fillna value 5 選擇行...