pandas時間序列

2021-10-05 21:57:50 字數 1981 閱讀 3596

import pandas as pd

import numpy as np

import datetime

df = pd.dataframe(

)df

# 將時間序列轉化為標準的年月日的形式

df['date'

]= pd.to_datetime(df[

'date'])

df

# 生成定頻日期與時間段序列

dt = pd.date_range(

'2020-03-01'

, periods=

5, freq=

'h')

dt

# 處理、轉換帶時區的日期時間資料

dt = dt.tz_localize(

'utc')dt

dt.tz_convert(

'us/pacific'

)

# 按指定頻率重取樣,並轉換為時間序列

dt = pd.date_range(

'2020-04-01'

, periods=

10, freq=

'h')

df = pd.series(

range

(len

(dt)

), index=dt)

df.resample(

'2h').

sum(

)

# 一般情況下,時間序列主要是series、dateframe的時間型別索引,可以用時間元素進行操作

df = pd.series(

range(10

), index=pd.date_range(

'2020-01-01'

, periods=

10, freq=

'd')

)df = pd.dataframe(

)df

# 時間戳是最基本的時間序列資料,用於把數值與時點關聯在一起。pandas 物件通過時間戳呼叫時點資料

pd.timestamp(datetime.datetime(

2020,1

,1))

pd.timestamp(

'2020-01-01'

)pd.timestamp(

2020,1

,1)

# 不過,大多數情況下,用時間段改變變數更自然。period 表示的時間段更直觀,還可以用日期時間格式的字串進行推斷

pd.period(

'2020-01'

)pd.period(

'2020-01'

, freq=

'd')

# 解析歐式日期(日-月-年),使用 dayfirst 關鍵字引數

pd.to_datetime(

['01-01-2020 8:00'

], dayfirst=

true

)

# 生成某個時間段的時間序列

pd.date_range(start=

'2020-01-01'

, end=

'2020-01-31'

, freq=

'd')

# 預設頻率是工作日

pd.bdate_range(start=

'2020-01-01'

, end=

'2020-01-31'

)pd.period_range(start=

'2020-01-01'

, end=

'2020-04-01'

, freq=

'm')

pandas 時間序列基礎

時間序列 time series 資料是一種重要的結構化資料形式。資料點是根據某種規律定期出現的 比如每15秒 每5分鐘 每月出現一次 時間序列也可以是不定期的,沒有固定的時間單位或單位之間的偏移量。時間序列資料的意義取決於具體的應用場景。python標準庫包含用於日期 date 和時間 time ...

pandas之時間序列

pandas中提供了許多用來處理時間格式文字的方法,包括按不同方法生成乙個時間序列,修改時間的格式,重取樣等等。in 7 import pandas as pd 按起始和終止日期以及步長生成時間序列 in 8 pd.date range start 20171212 end 20180101 fre...

pandas 時間序列滑動視窗

比如如下 lambda 函式實現了計算視窗內的平均絕對誤差 e x e x e x e x e x e x df.rolling window 10 lambda x np.fabs x x.mean mean raw true plot subplots true raw true 表示 lamb...