import pandas as pd
import numpy as np
import datetime
df = pd.dataframe(
)df
# 將時間序列轉化為標準的年月日的形式
df['date'
]= pd.to_datetime(df[
'date'])
df
# 生成定頻日期與時間段序列
dt = pd.date_range(
'2020-03-01'
, periods=
5, freq=
'h')
dt
# 處理、轉換帶時區的日期時間資料
dt = dt.tz_localize(
'utc')dt
dt.tz_convert(
'us/pacific'
)
# 按指定頻率重取樣,並轉換為時間序列
dt = pd.date_range(
'2020-04-01'
, periods=
10, freq=
'h')
df = pd.series(
range
(len
(dt)
), index=dt)
df.resample(
'2h').
sum(
)
# 一般情況下,時間序列主要是series、dateframe的時間型別索引,可以用時間元素進行操作
df = pd.series(
range(10
), index=pd.date_range(
'2020-01-01'
, periods=
10, freq=
'd')
)df = pd.dataframe(
)df
# 時間戳是最基本的時間序列資料,用於把數值與時點關聯在一起。pandas 物件通過時間戳呼叫時點資料
pd.timestamp(datetime.datetime(
2020,1
,1))
pd.timestamp(
'2020-01-01'
)pd.timestamp(
2020,1
,1)
# 不過,大多數情況下,用時間段改變變數更自然。period 表示的時間段更直觀,還可以用日期時間格式的字串進行推斷
pd.period(
'2020-01'
)pd.period(
'2020-01'
, freq=
'd')
# 解析歐式日期(日-月-年),使用 dayfirst 關鍵字引數
pd.to_datetime(
['01-01-2020 8:00'
], dayfirst=
true
)
# 生成某個時間段的時間序列
pd.date_range(start=
'2020-01-01'
, end=
'2020-01-31'
, freq=
'd')
# 預設頻率是工作日
pd.bdate_range(start=
'2020-01-01'
, end=
'2020-01-31'
)pd.period_range(start=
'2020-01-01'
, end=
'2020-04-01'
, freq=
'm')
pandas 時間序列基礎
時間序列 time series 資料是一種重要的結構化資料形式。資料點是根據某種規律定期出現的 比如每15秒 每5分鐘 每月出現一次 時間序列也可以是不定期的,沒有固定的時間單位或單位之間的偏移量。時間序列資料的意義取決於具體的應用場景。python標準庫包含用於日期 date 和時間 time ...
pandas之時間序列
pandas中提供了許多用來處理時間格式文字的方法,包括按不同方法生成乙個時間序列,修改時間的格式,重取樣等等。in 7 import pandas as pd 按起始和終止日期以及步長生成時間序列 in 8 pd.date range start 20171212 end 20180101 fre...
pandas 時間序列滑動視窗
比如如下 lambda 函式實現了計算視窗內的平均絕對誤差 e x e x e x e x e x e x df.rolling window 10 lambda x np.fabs x x.mean mean raw true plot subplots true raw true 表示 lamb...