整理 pandas 常用函式

2022-06-22 16:39:10 字數 1145 閱讀 8319

1. df.head(n): 顯示資料前n行,不指定n,df.head則會顯示所有的行

2. df.columns.values獲取所有列索引的名稱

3. df.column_name: 直接獲取列column_name的資料

4. pd.unique(series)獲取series中元素的唯一值(即去掉重複的)

注意和nunique的區別,nunique只作用於series,用法是series.nunique()

可以看得出,nuinque()是檢視該序列(axis=0/1對應著列或行)的不同值的數量。用這個函式可以檢視資料有多少個不同值。

5. max,min可直接作用於series取最大和最小值

6. pd.value_counts(series)統計series中不同元素出現的次數

7. df.groupby和agg的使用

(1)變數grouped是乙個dataframegroupby物件,它實際上還沒有進行任何計算,只是將資料進行了分組

(2)可以使用agg對分組好的資料進行處理,傳入的引數為函式,返回乙個標量結果。使用自定義的函式時應加引號。

下圖的例子是對分組好的資料按每列求平均值。

(3)agg的引數可以傳入多個函式

(4)還可以指定對不同的列使用不同的函式進行處理

8. df.index獲取行索引

9. 使用條件篩選:下列例子中的三個條件criteria1表示fueltype1中的元素滿足isin(),criteria2表示fueltype2中的元素滿足isnull(),

criteria3表示atvtype中的元素不等於『hybrid』,vehicles_non_hybrid = vehicles[criteria1&criteria2&criteria3]表示vehicles_non_hybrid

是vehicles同時滿足這三個條件篩選出來的資料。

參見

路雖遠,行必達!

pandas 常用函式整理

pandas常用函式整理,作為個人筆記。僅標記函式大概用途做索引用,具體使用方式請參照pandas官方技術文件。約定from pandas import series,dataframe import pandas as pd import numpy as np 帶.的為series或者dataf...

pandas常用操作整理

10 isin函式做篩選 11 缺失值處理 使用map函式就可以實現把某一列的字元型別的值轉換為數字。data class data class map首先定義乙個字典,然後使用map方法就可以把某一列的字元型別的值轉換為數字。參考 使用pandas把某一列的字元值轉換為數字的例項 使用value ...

pandas 常用函式

本文翻譯自文章 pandas cheat sheet python for data science 同時新增了部分註解。對於資料科學家,無論是資料分析還是資料探勘來說,pandas是乙個非常重要的python包。它不僅提供了很多方法,使得資料處理非常簡單,同時在資料處理速度上也做了很多優化,使得和...