三、模型檢驗
四、求解方法
分位數回歸是估計一組回歸變數x與被解釋變數y的分位數之間線性關係的建模方法。
以往的回歸模型實際上是研究被解釋變數的條件期望。而人們也關心解釋變數與被解釋變數分布的中位數,分位數呈何種關係。它最早由koenker和bassett(1978)提出。
ols回歸估計量的計算是基於最小化殘差平方。分位數回歸估計量的計算也是基於一種非對稱形式的絕對值殘差最小化。其中,中位數回歸運用的是最小絕對值離差估計(lad,least absolute deviations estimator)。
分位數回歸的優點
(1)能夠更加全面的描述被解釋變數條件分布的全貌,而不是僅僅分析被解釋變數的條件期望(均值),也可以分析解釋變數如何影響被解釋變數的中位數、分位數等。不同分位數下的回歸係數估計量常常不同,即解釋變數對不同水平被解釋變數的影響不同。
(2)中位數回歸的估計方法與最小二乘法相比,估計結果對離群值則表現的更加穩健,而且,分位數回歸對誤差項並不要求很強的假設條件,因此對於非正態分佈而言,分位數回歸係數估計量則更加穩健。
乙個連續隨機變數y
yy,其總體第τ
\tau
τ分位數是y(τ
)y(\tau)
y(τ)
的定義是:y
yy小於等於y(τ
)y(\tau)
y(τ)
的概率是τ
\tau
τ,即τ =p
(y⩽y
(τ))
=f(y
(τ))
\tau = p( y \leqslant y(\tau)) = f(y(\tau))
τ=p(y⩽
y(τ)
)=f(
y(τ)
)定理:連續變數用y
yy表示,其概率密度函式用f(y
)f(y)
f(y)
表示,累計概率密度函式用f(y
)f(y)
f(y)
表示,y
yy的中位數用y
(0.5)y_
y(0.5)
表示,則y
yy與任一值α
\alpha
α的離差絕對值的期望e(∣
y−α∣
)e(|y-\alpha|)
e(∣y−α
∣)以α =y
(0.5
)\alpha= y_
α=y(0.
5) 時為最小。
證明:
上文,萊布尼茨公式:
這裡,我是用了參變數積分求導才理解通。
另有其他角度的證明,從樣本出發,直覺上感覺也沒有太大問題,方便理解。
目標函式(15.3)不可微,因此傳統的對目標函式求導的方法不再適用。
以一元 回歸為例,如果用 lad 法估計的中位數回歸直線與用 ols 法估計的均值回歸直線有顯著差別, 則表明被解釋變數 y 的分布是非對稱的。如果散點圖上側分位數回歸直線之間與下側分位數回歸 直線之間相比,相互比較接近,則說明被解釋變數 y 的分布是左偏倚的。反之是右偏倚的。對於 不同分位數回歸函式如果回歸係數的差異很大,說明在不同分位數上解釋變數對被解釋變數的影 響是不同的。
1、擬合優度(goodness-of-fit)
2、擬似然比檢驗(quasi-likelihood ratio tests)
3、wald 檢驗
系列分位數回歸檢驗
1)斜率相等檢驗
2)對稱性檢驗
略點估計:
區間估計:
相關:roger koenker and kevin f. hallock. 「quantile regressioin」. journal of economic perspectives, volume 15, number 4, fall 2001, pages 143–156。
分位數回歸
分位數 quantile 亦稱分位點,是指將乙個隨機變數的概率分布範圍分為幾個等份的數值點,常用的有中位數 即二分位數 四分位數 百分位數等。任意乙個累計分布函式 f x f x f x 滿足 f x 0,1 f hat sigma,sigma in 0,1 f x 0,1 的 x hat x 稱為...
分位數回歸原理 分位數回歸及 Python 實現
一般的回歸方法是最小二乘法,即最小化誤差的平方和 其中,是真實值,而 是 值。而分位數的目標是最小化加權的誤差絕對值和 其中,是給定的分位數。決策變數是 可以證明,使上面表示式最小化的 就是給定分位數 對應的分位點 將上面式子轉化為連續密度函式的積分,然後求一階導數即可證明 上式也可以簡寫成 為了求...
Java初學者嘗試計算任意位數回文數
public static intcount int x if flag return count public static intfrom int x return num 用陣列的思想對數字進行拆分 public static int getarr int num,int x return a...