首先,pandas變形工具有:pivot、pivot_table、melt、wide_to_long、stack、unstack、crosstab、explode、get_dummies。
1、pivot與pivot_table
這兩個函式,就相當於excel表的資料****。
兩者的區別是:
pivot:不需要聚合函式;每行資料是唯一的,不存在重複資料,否則報錯。
pivot_table:用到聚合函式,可實現維度變化的資料統計功能
2、melt
melt 和 pivot 是一組互逆過程。
3、stack與unstack
索引變形工具。在 unstack 中必須保證 被轉為列索引的行索引層 和 被保留的行索引層 構成的組合是唯一的。
4、get_dummies
用於特徵構建的重要函式之一,其作用是把類別特徵轉為指示變數。相當於公升維。
參考資料:
dfs之變形課
dfs之變形課 題目傳送門 變形課呃 變形課上harry碰到了一點小麻煩,因為他並不像hermione那樣能夠記住所有的咒語而隨意的將乙個棒球變成刺蝟什麼的,但是他發現了變形咒語的乙個統一規律 如果咒語是以a開頭b結尾的乙個單詞,那麼它的作用就恰好是使a物體變成b物體.harry已經將他所會的所有咒...
pandas基礎 變形
import numpy as np import pandas as pd df pd.read csv data table.csv df.head 1 透視表 1 pivot 一般狀態下,資料在dataframe會以壓縮狀態存放,例如gender列中f和m一起存放,兩個類別被疊在一列中,piv...
pandas學習第4章 變形
二 其他變形方法 三 啞變數與因子化 一般狀態下,資料在dataframe會以壓縮 stacked 狀態存放,例如下面的gender,兩個類別被疊在一列中,pivot函式可將某一列作為新的cols df.pivot index id columns gender values height head...