ML 線性回歸系列(二) 基礎統計

2021-07-07 11:11:58 字數 858 閱讀 8266

華電北風吹

天津大學認知計算與應用重點實驗室

日期:2015/11/25

線性回歸是統計學裡面乙個非常重要的部分,在本系列的第二部分主要總結一些線性回歸的統計學指標。並且不定期更新。

一、統計學名詞

樣本與系列第一篇表示一樣表示為(x

(i),

y(i)

) ,模型對於x(

i)的**值為y^

(i)=

θ^tx

(i) ,所有樣本的y(

i)的均值表示為y¯

=1m∑

mi=1

y(i)

. 下面來看三個度量指標

1、總離差平方和 ss

t=∑m

i=1(

y(i)

−y¯)

2 2、誤差平方和(殘差平方和) ss

e=∑m

i=1(

y(i)

−y^(

i))2

3、回歸平方和 ss

r=∑m

i=1(

y^(i

)−y¯

)2並且對於這三個指標有 ss

t=ss

e+ss

r 二、線性回歸顯著性指標

1、復相關係數 r2

=ssr

sst=

1−ss

tsst

很顯然r值範圍為[0,1],並且r越接近與1,說明線性關係越強。

2、f檢驗 f=

ssr/

n−1s

se/m

−n服從f(

n−1,

m−n)

分布,因此可以使用f檢驗來判斷回歸顯著性。

ML 線性回歸系列(三) 嶺回歸

華電北風吹 日期 2015 11 25 本文主要對嶺回歸 ridge regression 進行總結。本系列的第一篇中線性回歸的轉化為如下的無約束優化問題 min m i 1 y i tx i 2 0 1 其中,x i r n 1 表示每個樣本都是n維向量,y i 表示樣本x i 對應的標籤,rn ...

ML 線性回歸系列(四) lasso mtl

andrew zhang nov 25,2015 本文主要對套索回歸 lasso 進行總結。本系列的第一篇中線性回歸的轉化為如下的無約束優化問題 min m i 1 y i tx i 2 0 1 其中,x i r n 1 表示每個樣本都是n維向量,y i 表示樣本x i 對應的標籤,rn 1 表示引...

ML 線性回歸

說句廢話,相信大多數人和我一樣,最開始學習機器學習遇到的第乙個模型便是線性回歸,而且是一元線性回歸,但就這個模型,其實包含了很多的知識點,矩陣計算,最小二乘 梯度下降等知識點。我認為非常的有趣。這裡只是乙個簡單的介紹。1問題的引入 假設有乙個房屋銷售的資料如下 面積銷售 123250 150320 ...