分位數(quantile),亦稱分位點,是指將乙個隨機變數的概率分布範圍分為幾個等份的數值點,常用的有中位數(即二分位數)、四分位數、百分位數等。
任意乙個累計分布函式 f(x
)f(x)
f(x)
,滿足 f(x
^)=σ
,σ∈(
0,1)
f(\hat) = \sigma, \sigma\in (0,1)
f(x^)=
σ,σ∈
(0,1
) 的 x
^\hat
x^,稱為分布 f
ff 的分位數。
σ
\sigma
σ 的含義是該分布中小於x
^\hat
x^的數佔比為σ
\sigma
σ,即p(x
)=σp(xp(x
)=σ。
給定乙個平穩時間序列,我們通常為考慮回歸出它的均值。但在更一般的情況下,我們希望回歸出樣本對應分布的分位點,因為分位點更能反映出分布的性質。
下面用乙個例子來說明:
可以直接畫出經驗概率分布函式
在概率分布函式上找分位點太容易了,在縱軸上確定σ
\sigma
σ,回到橫軸上找x
^\hat
x^在一般的時間序列**問題中,我們通常是用乙個函式取擬合序列,通常學習到的函式是對真實樣本均值的估計。
有沒有辦法讓學習函式去逼近真實樣本的分位點呢?
只需要使用如下損失函式:
l (y
,y^)
=σmax(y
−y^,
0)+(
1−σ)
max(y
^−y,
0)l(y,\hat) = \sigma\max (y-\hat,0) + (1-\sigma)\max(\hat-y,0)
l(y,y^
)=σ
max(y−
y^,
0)+(
1−σ)
max(y^
−y,
0)∂ l(
y,y^
)∂y^
=−σi
(y−y
^)+(
1−σ)
i(y^
−y)\frac)}} = -\sigma\mathbb)} + (1-\sigma)\mathbb-y)}
∂y^∂l
(y,y
^)
=−σi
(y−y
^)+
(1−σ
)i(y
^−y
)其中 y
^\hat
y^ 是輸出,y
yy 為目標值。
可以看出,提出下降法很好地找到了序列的分位點,和直接用概率分布函式的結果一致。
分位數回歸原理 分位數回歸及 Python 實現
一般的回歸方法是最小二乘法,即最小化誤差的平方和 其中,是真實值,而 是 值。而分位數的目標是最小化加權的誤差絕對值和 其中,是給定的分位數。決策變數是 可以證明,使上面表示式最小化的 就是給定分位數 對應的分位點 將上面式子轉化為連續密度函式的積分,然後求一階導數即可證明 上式也可以簡寫成 為了求...
分位數回歸 Quantile regression
三 模型檢驗 四 求解方法 分位數回歸是估計一組回歸變數x與被解釋變數y的分位數之間線性關係的建模方法。以往的回歸模型實際上是研究被解釋變數的條件期望。而人們也關心解釋變數與被解釋變數分布的中位數,分位數呈何種關係。它最早由koenker和bassett 1978 提出。ols回歸估計量的計算是基於...
Java初學者嘗試計算任意位數回文數
public static intcount int x if flag return count public static intfrom int x return num 用陣列的思想對數字進行拆分 public static int getarr int num,int x return a...