我們通過乙個例子來介紹通過r語言進行一元回歸的方法
例子:為研究某實驗過程中,溫度x(℃)對產品得率(%)的影響,測得資料如下:
溫度x(℃)
100110
120130
140150
160170
180190
得率y(%)
4551
5461
6670
7478
8589
說明:該例子來自盛驟等老師編寫的第四版概率論與數理統計書籍首先,我們把x,y數值之間的聯絡先用散點圖描繪出來:
p = c(100,110,120,130,140,150,160,170,180,190)
q = c(45,51,54,61,66,70,74,78,85,89)
plot(p,q,type="p",col="blue",xlab="x",ylab="y")
執行結果:
從上面散點圖我們可以看出,x與y之間的相關性很強,近似一種線性關係。一元回歸的目的就是擬合出一條回歸直線,使得散點圖上的每一點與這條直線的縱向距離最短。通過擬合出的回歸直線,可以用於**。 設:y
=a+b
x+ε,
εn(0
,σ2)
對引數a,b進行估計:
其中: b̂
=∑ni
=1(x
i−x̅
)(yi
−y̅)
∑ni=
1(xi
−x̅)
2 â
=y̅−
b̂ x̅
y=â +b̂
x̅即為y關於x的回歸方程。
現在,我們使用r語言來求引數a和b
方法一:
p = c(100,110,120,130,140,150,160,170,180,190)
q = c(45,51,54,61,66,70,74,78,85,89)
plot(p,q,type="p",col="blue",xlab="x",ylab="y")
lxyb = lxy(p,q)/lxy(p,p)
a = mean(q)-b*mean(p)
print(b)
print(a)
lines(p,a+b*p)
執行結果:
[1] 0.4830303
[1]-2
.739394
函式影象:
即:回歸方程為y=
−2.739394
+0.4830303∗x
p = c(100,110,120,130,140,150,160,170,180,190)
q = c(45,51,54,61,66,70,74,78,85,89)
r=lm(q~1+p)
print(summary(r))
執行結果:
call:
lm(formula = q ~ 1 + p)
residuals:
min 1q median 3q max
-1.3758 -0.5591 0.1242 0.7470 1.1152
coefficients:
estimate std. error t value pr(>|t|)
(intercept) -2.73939 1.54650 -1.771 0.114
p 0.48303 0.01046 46.169 5.35e-11 ***
---signif. codes:
0 『***』 0.001 『*
*』 0.01 『*』 0.05 『.』 0.1 『 』 1
residual standard error: 0.9503 on 8 degrees of freedom
multiple r-squared: 0.9963, adjusted r-squared: 0.9958
f-statistic: 2132 on 1 and 8 df, p-value: 5.353e-11
r中提供了lm( )函式來進行回歸分析,使用summary( )可以得到回歸結果的所有引數。其中,p後面的三個星號***表示引數的估計是很顯著的。 R語言 一元線性回歸
一元線性回歸的基本步驟 1.載入資料 給出散點圖 x plot x,y 2.線性回歸 得到回歸方程 並檢視回歸結果 所得回歸方程為y 130.83x 28.49 3.線性擬合 abline cg 新增擬合直線 4.x0 0.16時相應y的概率為0.95的 區間 x0 pred prediction ...
R語言 一元線性回歸學習記錄
基礎知識需要了解正態分佈,t檢驗值,p value值,顯著性檢驗等。下面是 與注釋講解 csvpath csvpath dfdfx y xy plot y x 1 jhy1 x 建立線性回歸模型 jhyxm 呼叫mean函式求均值 xmplot y x 1 繪製回歸線 abline jhy 繪製擬合...
用R進行一元線性回歸分析建模
概念 一元線性回歸 是指成對的兩個變數資料的散點圖呈現出直線趨勢時,採用最小二乘法,找到兩者之間的經驗公式,即一元線性回歸 模型。根據自變數的變化,來估計因變數變化的 方法。我用的是r內建資料集mtcars,要 的是當每加侖汽油能跑23英里 mpg 23 的車有多重 wt?下面貼一下 較簡單,但重要...