函式下午茶(6) Pandas 最後四個函式

2021-10-17 08:44:26 字數 4803 閱讀 3363

介紹

dataframe.pct_change(periods=

1, fill_method=

'pad'

, limit=

none

, freq=

none

,**kwargs)

當前元素和先前元素之間的百分⽐變化。預設情況下,計算與前⼀⾏相⽐的百分⽐變化。這在⽐較元素時間序列的變化百分⽐時很有⽤。

引數說明

引數介紹

periods

整型,預設為1,⽤於形成百分⽐轉換週期

fill_method

字元型,預設』pad』。na處理⽅法選擇

limit

整型。處理na的數量

freq

時間序列api使⽤增量(e.g. 『m』 or bday())

舉例

1

#⽣成資料來源

2 df = pd.dataframe(

,6 index=

['1980-01-01'

,'1980-02-01'

,'1980-03-01'])

7 df

8>> fr gr it

91980-01

-014.0405

1.7246

804.74

101980-02

-014.0963

1.7482

810.01

111980-03

-014.3149

1.8519

860.13

12#計算各列隨著時間變化的百分⽐,新增axis=』columns』引數可以計算橫向百分⽐

13 df.pct_change()14

>> fr gr it

151980-01

-01 nan nan nan

161980-02

-010.013810

0.013684

0.00654917.

1980-03

-010.053365

0.059318

0.061876

介紹

返回固定頻率的⽇期時間索引

pandas.date_range(start=

none

,end=

none

,periods=

none

,freq=

none

,tz=

none

, normalize=

false

,name=

none

, closed=

none

,**kwargs)

引數說明

引數介紹

start

字元型,datetime-like資料。⽇期開始

end字元型,datetime-like資料。⽇期結束

periods

整數型,⽣成週期數

freq

字元型,預設』d』。頻率串可以擁有倍數

tz字元型,返回本地時區,例』asia/hong_kong.』

normalize

bool,規範化時間

name

字元型,時間索引名稱

closed

,閉合區間選擇

舉例

1

#⽣成⼀個具有5個時間段,時⻓間隔3個⽉的時間序列

2 pd.date_range(start=

'1/1/2018'

, periods=

5, freq=

'3m'

)3 datetimeindex(

['2018-01-31'

,'2018-04-30'

,'2018-07-31'

,'2018-10-31',4

'2019-01-31'],

5 dtype=

'datetime64[ns]'

, freq=

'3m')6

#⽣成⼀個具有5個時間段,時⻓間隔為1天的亞洲\東京時區時間序列

7 pd.date_range(start=

'1/1/2018'

, periods=

5, tz=

'asia/tokyo')8

>> datetimeindex(

['2018-01-01 00:00:00+09:00'

,'2018-01-02 00:00:00+09:00',9

'2018-01-03 00:00:00+09:00'

,'2018-01-04 00:00:00+09:00',10

'2018-01-05 00:00:00+09:00'],

11 dtype=

'datetime64[ns, asia/tokyo]'

, freq=

'd')

關於時間的處理在資料分析中經常遇到,合理的使⽤時間轉換能夠減少統計⼯作量,關於時間序列的處

理,更詳細請參考官⽅教

程:點這兒

介紹

沿著軸對數值進⾏排序

dataframe.sort_values(by, axis=

0, ascending=

true

, inplace=

false

, kind=

'quicksort'

,na_position=

'last'

, ignore_index=

false

, key=

none

)

引數說明

引數介紹

by按照某⼀個標籤索引排序

axis

,預設0,排序軸向

ascending

預設true,公升序排序。

inplace

預設false,不替換原資料

kind

字元型,排序⽅式。quicksort』, 『mergesort』, 『heapsort』三種⽅式

na_position

,nan放置位置。

ignore_index

預設false,不對索引進⾏重新排序。

舉例

#⽣成資料來源

df = pd.dataframe(

) df

>> col1 col2 col3 col4

0 a 2

0 a

1 a 1

1 b

2 b 9

9 c

3 nan 8

4 d

4 d 7

2 e

5 c 4

3 f

#對資料按col1列的降序排列,nan值放置在頭部

df.sort_values(by=

'col1'

, ascending=

false

, na_position=

'first'

)>> col1 col2 col3 col4

3 nan 8

4 d

4 d 7

2 e

5 c 4

3 f

2 b 9

9 c

0 a 2

0 a

1 a 1

1 b

介紹

沿著資料的軸應⽤函式,返回使⽤函式後的值。

dataframe.

(func, axis=

0, raw=

false

, result_type=

none

, args=()

,**kwds)

引數說明

引數介紹

func

函式,每列或⾏使⽤的函式

axis

預設0,沿著列使⽤函式

raw預設false,確定⾏或者列是作為序列還是陣列物件傳遞的。

result_type

,預設none,結果返回⽅式。

args

除了陣列序列外,要傳遞給func的位置引數

舉例

#⽣成⼀個資料來源

df = pd.dataframe([[

4,9]

]*3, columns=

['a'

,'b'])

df >> a b

0491

4924

9#對每列資料求和

df.(np.

sum, axis=0)

>> a 12

b 27

dtype: int64

# 將每⼀⾏資料程式設計匿名函式lambda的返回值

df.(lambda x:[1

,2], axis=1)

>>0[

1,2]

.1[1

,2]2

[1,2

] dtype:

object

週末下午茶

好久沒來這裡了,原來你也在這裡 昨天張到我這裡來,不經意間說起,我們已經快三十歲了,淡淡的說了,淡淡的笑了,可那句話卻一直在我腦海裡,我想忘掉它,甩掉它,卻怎麼也甩不掉.也許是人生就是這樣,你越是想忘掉什麼,越是不想什麼,可它卻無時無刻不在你的腦海裡.我已經心力憔悴,週日晚上被它折磨得一夜未合眼,因...

麼麼下午茶

做職業經理人久了,一直有個夢想就在心中偷偷長草,那就是,夢想在大學的旁邊開一間店,店名就叫 麼麼下午茶 麼麼下午茶 什麼意思,我也不知道,我只記得任賢齊和鄭秀文的一部影片就是這個名字,可惜我沒有看過。在我的臆想中,那個電影一定有非常藍的天,有碧藍的大海,有海難,有檸檬冰茶。輕輕的踩在沙灘上,看著浪花...

6月27日CTO俱樂部下午茶印象

感謝csdn的邀請,有幸參加了6月27日 cto俱樂部下午茶時光 cto在團隊管理中所遇到的那些事 活動。本期的主講嘉賓是酷訊旅遊的技術副總謝欣。破冰之後謝欣正式開始他的分享。首先他提出乙個觀點 團隊管理是一門科學而非藝術,理由是科學是可以學習而藝術主要靠天賦。接下來謝欣以乙個個case來介紹他在團...