介紹
dataframe.pct_change(periods=
1, fill_method=
'pad'
, limit=
none
, freq=
none
,**kwargs)
當前元素和先前元素之間的百分⽐變化。預設情況下,計算與前⼀⾏相⽐的百分⽐變化。這在⽐較元素時間序列的變化百分⽐時很有⽤。
引數說明
引數介紹
periods
整型,預設為1,⽤於形成百分⽐轉換週期
fill_method
字元型,預設』pad』。na處理⽅法選擇
limit
整型。處理na的數量
freq
時間序列api使⽤增量(e.g. 『m』 or bday())
舉例
1
#⽣成資料來源
2 df = pd.dataframe(
,6 index=
['1980-01-01'
,'1980-02-01'
,'1980-03-01'])
7 df
8>> fr gr it
91980-01
-014.0405
1.7246
804.74
101980-02
-014.0963
1.7482
810.01
111980-03
-014.3149
1.8519
860.13
12#計算各列隨著時間變化的百分⽐,新增axis=』columns』引數可以計算橫向百分⽐
13 df.pct_change()14
>> fr gr it
151980-01
-01 nan nan nan
161980-02
-010.013810
0.013684
0.00654917.
1980-03
-010.053365
0.059318
0.061876
介紹
返回固定頻率的⽇期時間索引
pandas.date_range(start=
none
,end=
none
,periods=
none
,freq=
none
,tz=
none
, normalize=
false
,name=
none
, closed=
none
,**kwargs)
引數說明
引數介紹
start
字元型,datetime-like資料。⽇期開始
end字元型,datetime-like資料。⽇期結束
periods
整數型,⽣成週期數
freq
字元型,預設』d』。頻率串可以擁有倍數
tz字元型,返回本地時區,例』asia/hong_kong.』
normalize
bool,規範化時間
name
字元型,時間索引名稱
closed
,閉合區間選擇
舉例
1
#⽣成⼀個具有5個時間段,時⻓間隔3個⽉的時間序列
2 pd.date_range(start=
'1/1/2018'
, periods=
5, freq=
'3m'
)3 datetimeindex(
['2018-01-31'
,'2018-04-30'
,'2018-07-31'
,'2018-10-31',4
'2019-01-31'],
5 dtype=
'datetime64[ns]'
, freq=
'3m')6
#⽣成⼀個具有5個時間段,時⻓間隔為1天的亞洲\東京時區時間序列
7 pd.date_range(start=
'1/1/2018'
, periods=
5, tz=
'asia/tokyo')8
>> datetimeindex(
['2018-01-01 00:00:00+09:00'
,'2018-01-02 00:00:00+09:00',9
'2018-01-03 00:00:00+09:00'
,'2018-01-04 00:00:00+09:00',10
'2018-01-05 00:00:00+09:00'],
11 dtype=
'datetime64[ns, asia/tokyo]'
, freq=
'd')
關於時間的處理在資料分析中經常遇到,合理的使⽤時間轉換能夠減少統計⼯作量,關於時間序列的處
理,更詳細請參考官⽅教
程:點這兒
介紹
沿著軸對數值進⾏排序
dataframe.sort_values(by, axis=
0, ascending=
true
, inplace=
false
, kind=
'quicksort'
,na_position=
'last'
, ignore_index=
false
, key=
none
)
引數說明
引數介紹
by按照某⼀個標籤索引排序
axis
,預設0,排序軸向
ascending
預設true,公升序排序。
inplace
預設false,不替換原資料
kind
字元型,排序⽅式。quicksort』, 『mergesort』, 『heapsort』三種⽅式
na_position
,nan放置位置。
ignore_index
預設false,不對索引進⾏重新排序。
舉例
#⽣成資料來源
df = pd.dataframe(
) df
>> col1 col2 col3 col4
0 a 2
0 a
1 a 1
1 b
2 b 9
9 c
3 nan 8
4 d
4 d 7
2 e
5 c 4
3 f
#對資料按col1列的降序排列,nan值放置在頭部
df.sort_values(by=
'col1'
, ascending=
false
, na_position=
'first'
)>> col1 col2 col3 col4
3 nan 8
4 d
4 d 7
2 e
5 c 4
3 f
2 b 9
9 c
0 a 2
0 a
1 a 1
1 b
介紹
沿著資料的軸應⽤函式,返回使⽤函式後的值。
dataframe.
(func, axis=
0, raw=
false
, result_type=
none
, args=()
,**kwds)
引數說明
引數介紹
func
函式,每列或⾏使⽤的函式
axis
預設0,沿著列使⽤函式
raw預設false,確定⾏或者列是作為序列還是陣列物件傳遞的。
result_type
,預設none,結果返回⽅式。
args
除了陣列序列外,要傳遞給func的位置引數
舉例
#⽣成⼀個資料來源
df = pd.dataframe([[
4,9]
]*3, columns=
['a'
,'b'])
df >> a b
0491
4924
9#對每列資料求和
df.(np.
sum, axis=0)
>> a 12
b 27
dtype: int64
# 將每⼀⾏資料程式設計匿名函式lambda的返回值
df.(lambda x:[1
,2], axis=1)
>>0[
1,2]
.1[1
,2]2
[1,2
] dtype:
object
週末下午茶
好久沒來這裡了,原來你也在這裡 昨天張到我這裡來,不經意間說起,我們已經快三十歲了,淡淡的說了,淡淡的笑了,可那句話卻一直在我腦海裡,我想忘掉它,甩掉它,卻怎麼也甩不掉.也許是人生就是這樣,你越是想忘掉什麼,越是不想什麼,可它卻無時無刻不在你的腦海裡.我已經心力憔悴,週日晚上被它折磨得一夜未合眼,因...
麼麼下午茶
做職業經理人久了,一直有個夢想就在心中偷偷長草,那就是,夢想在大學的旁邊開一間店,店名就叫 麼麼下午茶 麼麼下午茶 什麼意思,我也不知道,我只記得任賢齊和鄭秀文的一部影片就是這個名字,可惜我沒有看過。在我的臆想中,那個電影一定有非常藍的天,有碧藍的大海,有海難,有檸檬冰茶。輕輕的踩在沙灘上,看著浪花...
6月27日CTO俱樂部下午茶印象
感謝csdn的邀請,有幸參加了6月27日 cto俱樂部下午茶時光 cto在團隊管理中所遇到的那些事 活動。本期的主講嘉賓是酷訊旅遊的技術副總謝欣。破冰之後謝欣正式開始他的分享。首先他提出乙個觀點 團隊管理是一門科學而非藝術,理由是科學是可以學習而藝術主要靠天賦。接下來謝欣以乙個個case來介紹他在團...