首先你要明白diff這個函式的作用,它是用來求差值的,即再df中後一項減前一項的差,記錄在後一項的位置上,或者右邊減左邊的差,記錄在左邊的位置上,下面具體以兩個方面來演示一下。
一、基本用法
二、高階用法
很多人可能都知道上面的簡單用法,但是在具體的專案中,其實並不是後面減前面,或者右邊減左邊這麼簡單。下面是我在專案中用到的,根據不同的指標進行分組求同一指標之間的差值,不同指標的不會計算。
首先取出資料後我先根據指標做了乙個排序,這個排序是非常重要的,很多時候順序亂了,你算出來的值也就錯了。緊接著用排序後的資料做乙個分組,然後求同一組之間【index_value】的差值,賦值給【income】。最後一步是乙個填充,因為每個分組都有第乙個數是nan,根據你的需要填充nan值,我這裡用的是向左填充index_value
的值。後面再細說一下fillna的一些引數。
pandas中shift和diff函式關係簡單總結
signature pandas.dataframe.shift self,periods 1,freq none,axis 0 shift方法 signature pandas.dataframe.diff self,periods 1,axis 0 diff方法 先簡單總結 shift可以移動d...
pandas中 value counts 的用法
value counts 是一種檢視 某列中有多少個不同值的快捷方法,並計算每個不同值有在該列中有多少重複值。value counts 是series擁有的方法,一般在dataframe中使用時,需要指定對哪一列或行使用,該函式返回的也是series型別,且index為該列的不同值,values為不...
pandas 中diff 一階差分的理解
diff函式是用來將資料進行某種移動之後與原資料進行比較得出的差異資料,舉個例子,現在有乙個dataframe型別的資料df,如下 index value1a0 b1c2 d3如果執行 df.diff 則會得到 index value1 ananb1 c1d1 怎麼得到的呢,其實是經過了兩個步驟,首...