初識Prophet模型(一) 理論篇

2021-10-13 15:37:40 字數 2231 閱讀 4734

1、prophet 簡介

2、prophet 適用場景

3、prophet 演算法的輸入輸出

4、prophet 演算法原理

5、prophet 使用時可設定的引數

6、prophet 學習資料參考

7、prophet 模型應用fbprophet是facebook開源的乙個時間序列**演算法。

prophet庫可以做的

prophet適用於具有明顯的內在規律的商業行為資料,例如:有如下特徵的業務問題:

上圖為乙個時間序列場景:

傳入prophet的資料分為兩列dsy,ds表示時間序列的時間戳,y表示時間序列的取值

其中:通過 prophet 的計算,可以計算出:

演算法模型:

$ y(t)=g(t)+s(t)+h(t)+\epsilon_ $

模型整體由三部分組成:

其中:prophet 演算法就是通過擬合這幾項,然後最後把它們累加起來就得到了時間序列的**值。

4.1 趨勢項模型$ g(t)$

趨勢項有兩個重要的函式,乙個是基於邏輯回歸函式的(非線性增長),另乙個是基於分段線性函式的(線性增長)

4.1.1 基於邏輯回歸的趨勢項:

$ g(t) = \frac(t)^\boldsymbol) \cdot (t - (m+\boldsymbol(t)^\boldsymbol)},

,,\boldsymbol(t) = (a_(t),\cdots,a_(t))^, \boldsymbol = (\delta_,\cdots,\delta_)^, \boldsymbol = (\gamma_,\cdots,\gamma_)^$

其中,

k 表示增長率:

m 表示偏移量:

4.1 2 基於分段線性函式的趨勢項:g(t

)=(k

+a(t

)tδ)

⋅t+(

m+a(

t)tγ

)g(t)=(k+\boldsymbol(t)^\boldsymbol)\cdot t+(m+\boldsymbol(t)^\boldsymbol)

g(t)=(

k+a(

t)tδ

)⋅t+

(m+a

(t)t

γ)其中,

4.1.3 變點的選擇

在 prophet 演算法中,有三個比較重要的指標,分別為:

其中:在預設的場景下,變點的選擇是基於時間序列的前 80% 的歷史資料,然後通過等分的方法找到 25 個變點,而變點的增長率是滿足 laplace 分布 δj∼

lapl

ace(

0,0.05

)\delta_ \sim laplace (0,0.05)

δj​∼la

plac

e(0,

0.05

) 的。因此,當$ \tau 趨近於

零的時候

,趨近於零的時候,

趨近於零的時

候,\delta_ $也是趨向於零的,此時的增長函式將變成全段的邏輯回歸函式或者線性函式。

4.1.4 對未來的預估

4.2 季節性趨勢 s(t

)s(t)

s(t)

由於時間序列中有可能包含多種天,周,月,年等週期型別的季節性趨勢,因此,傅利葉級數可以用來近似表達這個週期屬性。

因此時間序列的季節項就是:s(t

)=x(

t)βs(t) = x(t) \boldsymbol

s(t)=x

(t)β

其中,4.3 節假日效應 h(t

)h(t)

h(t)

假設有 l 個節假日,那麼節假日效應模型就是:h(t

)=z(

t)κ=

∑i=1

lκi⋅

1h(t)=z

(t)κ

=∑i=

1l​κ

i​⋅1

​其中,

預設值是 10,當值越大時,表示節假日對模型的影響越大;當值越小時,表示節假日對模型的效果越小。

該引數可自行調整。

初識機器學習 理論篇

1.什麼是機器學習?概念 利用計算機從歷史資料中找到規律,並把這些規律用到未來不確定場景的決策。場景 人來幹 資料分析 計算機來幹 機器學習 2.資料 歷史資料 3.規律 從資料中找出規律 概率論和數理統計 先抽樣 描述統計 假設檢驗 用模型刻畫 擬合 規律 維度較少時還能用,多維的不可用 4.機器...

正規化篇之一正規化理論

關係模型原理的核心是 規範化 概念,規範化是把資料庫組織成在儲存儲存資料完整性的同時,最小化冗餘資料的結構的過程 規範化的資料庫是符合關係模型規則的資料庫,通常把這些規則稱為正規化 正規化是符合某一種級別的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求即滿足不同的正規化,目前關係型資料庫有六...

正規化篇之一正規化理論

關係模型原理的核心是 規範化 概念,規範化是把資料庫組織成在儲存儲存資料完整性的同時,最小化冗餘資料的結構的過程 規範化的資料庫是符合關係模型規則的資料庫,通常把這些規則稱為正規化 正規化是符合某一種級別的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求即滿足不同的正規化,目前關係型資料庫有六...