從許多方面來看,回歸分析都是統計學的核心。它其實是乙個廣義的概念,通指那些用乙個或多個**變數(也稱自變數或解釋變數)來**響應變數(也稱因變數、效標變數或結果變數)的方法。即通過已知的點來建立擬合模型,用給定的x值來**y值,找到一條合適的擬合曲線,算出合適的斜率和方差。只有乙個自變數的情況稱為簡單回歸,大於乙個自變數情況的叫做多元回歸。
線性模型:
0和β1是回歸係數,
ε表示誤差。
在r中,擬合線性模型最基本的函式就是lm()。
例項:物理學家
james.d
.forbes
試圖通過水的沸點來估計海拔高度,他知道通過氣壓計測得的大氣壓可用於得到海拔高度,氣壓越低,高度越高,他測量了
17個地方水的沸點(℉)及大氣壓資料,並且對資料作了簡單的處理,得到了較為明確的數學關係,所提資料如下:
首先錄入資料:
x=matrix(c(194.5,20.79,1.3179,131.79,194.3,20.79,1.3179,131.79,197.9,22.40,1.3502,
135.02,198.4,22.67,1.3555,135.55,199.4,23.15,1.3646,136.46,199.9,23.35,
1.3683,136.83,200.9,23.89,1.3782,137.82,201.1,23.99,1.3800,138.00,201.4,
24.02,1.3806,138.06,201.3,24.01,1.3805,138.05,203.6,25.14,1.4004,140.04,
204.6,26.57,1.4244,142.44,209.5,28.49,1.4547,145.47,208.6,27.76,1.4434,
144.34,210.7,29.04,1.4630,146.30,211.9,29.88,1.4754,147.54,212.2,30.06,
1.4780,147.80),ncol=4,byrow=t,dimnames=list(1:17,c('f','h','log','log100')))
資料結果為:
#強制轉換為資料框
plot(forbes$f,forbes$log100) #檢視f和log100之間的關係
lm.sol=lm(log100~f,data=forbes) #擬合模型
可以得出**模型為:
y = -42.13087 + 0.89546x
殘差分析:
由圖中可發現 12 那點偏離比較遠,對結果影響較大,可以把奇異點剔除掉。
模型診斷:
用R語言做簡單線性回歸和指數線性回歸
x y首先先計算他們的相關性 cor x,y 值為 0.964 fitcoef fit 檢視回歸函式係數結果為 intercept x 2.082360e 05 1.494401e 02 所謂線性回歸就是 y a bx 求a,b的值。結果中,a值就是intercept截距值,b值為第二個x系數值。我...
R語言學習筆記 8 線性回歸
erg tutorial 3 linear model a lm medv lstat i lstat 2 date boston 對lstat和lstat 2進行線性回歸 a lm medv poly lstat,5 date boston 對lstat,lstat 2 lstat 3進行線性回歸...
簡單線性回歸
真實值 y theta x varepsilon 值 hat theta x varepsilon 為誤差 項,服從 均值為0 方差為 為誤差項,服從均值為0,方差為 為誤差項,服 從均值為 0,方差 為 sigma 的高斯分布。已知若干樣本,可以得到若干 varepsilon 值,根 據極大似 然...