1、prophet 簡介
2、prophet 適用場景
3、prophet 演算法的輸入輸出
4、prophet 演算法原理
5、prophet 使用時可設定的引數
6、prophet 學習資料參考
7、prophet 模型應用fbprophet是facebook開源的乙個時間序列**演算法。
prophet庫可以做的
prophet適用於具有明顯的內在規律的商業行為資料,例如:有如下特徵的業務問題:
上圖為乙個時間序列場景:
傳入prophet的資料分為兩列ds和y,ds表示時間序列的時間戳,y表示時間序列的取值
其中:通過 prophet 的計算,可以計算出:
演算法模型:
$ y(t)=g(t)+s(t)+h(t)+\epsilon_ $
模型整體由三部分組成:
其中:prophet 演算法就是通過擬合這幾項,然後最後把它們累加起來就得到了時間序列的**值。
4.1 趨勢項模型$ g(t)$
趨勢項有兩個重要的函式,乙個是基於邏輯回歸函式的(非線性增長),另乙個是基於分段線性函式的(線性增長)
4.1.1 基於邏輯回歸的趨勢項:
$ g(t) = \frac(t)^\boldsymbol) \cdot (t - (m+\boldsymbol(t)^\boldsymbol)},
,,\boldsymbol(t) = (a_(t),\cdots,a_(t))^, \boldsymbol = (\delta_,\cdots,\delta_)^, \boldsymbol = (\gamma_,\cdots,\gamma_)^$
其中,
k 表示增長率:
m 表示偏移量:
4.1 2 基於分段線性函式的趨勢項:g(t
)=(k
+a(t
)tδ)
⋅t+(
m+a(
t)tγ
)g(t)=(k+\boldsymbol(t)^\boldsymbol)\cdot t+(m+\boldsymbol(t)^\boldsymbol)
g(t)=(
k+a(
t)tδ
)⋅t+
(m+a
(t)t
γ)其中,
4.1.3 變點的選擇
在 prophet 演算法中,有三個比較重要的指標,分別為:
其中:在預設的場景下,變點的選擇是基於時間序列的前 80% 的歷史資料,然後通過等分的方法找到 25 個變點,而變點的增長率是滿足 laplace 分布 δj∼
lapl
ace(
0,0.05
)\delta_ \sim laplace (0,0.05)
δj∼la
plac
e(0,
0.05
) 的。因此,當$ \tau 趨近於
零的時候
,趨近於零的時候,
趨近於零的時
候,\delta_ $也是趨向於零的,此時的增長函式將變成全段的邏輯回歸函式或者線性函式。
4.1.4 對未來的預估
4.2 季節性趨勢 s(t
)s(t)
s(t)
由於時間序列中有可能包含多種天,周,月,年等週期型別的季節性趨勢,因此,傅利葉級數可以用來近似表達這個週期屬性。
因此時間序列的季節項就是:s(t
)=x(
t)βs(t) = x(t) \boldsymbol
s(t)=x
(t)β
其中,4.3 節假日效應 h(t
)h(t)
h(t)
假設有 l 個節假日,那麼節假日效應模型就是:h(t
)=z(
t)κ=
∑i=1
lκi⋅
1h(t)=z
(t)κ
=∑i=
1lκ
i⋅1
其中,
預設值是 10,當值越大時,表示節假日對模型的影響越大;當值越小時,表示節假日對模型的效果越小。
該引數可自行調整。
初識機器學習 理論篇
1.什麼是機器學習?概念 利用計算機從歷史資料中找到規律,並把這些規律用到未來不確定場景的決策。場景 人來幹 資料分析 計算機來幹 機器學習 2.資料 歷史資料 3.規律 從資料中找出規律 概率論和數理統計 先抽樣 描述統計 假設檢驗 用模型刻畫 擬合 規律 維度較少時還能用,多維的不可用 4.機器...
正規化篇之一正規化理論
關係模型原理的核心是 規範化 概念,規範化是把資料庫組織成在儲存儲存資料完整性的同時,最小化冗餘資料的結構的過程 規範化的資料庫是符合關係模型規則的資料庫,通常把這些規則稱為正規化 正規化是符合某一種級別的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求即滿足不同的正規化,目前關係型資料庫有六...
正規化篇之一正規化理論
關係模型原理的核心是 規範化 概念,規範化是把資料庫組織成在儲存儲存資料完整性的同時,最小化冗餘資料的結構的過程 規範化的資料庫是符合關係模型規則的資料庫,通常把這些規則稱為正規化 正規化是符合某一種級別的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求即滿足不同的正規化,目前關係型資料庫有六...