R語言 一元線性回歸學習記錄

2021-10-22 12:17:05 字數 2556 閱讀 3487

基礎知識需要了解正態分佈,t檢驗值,p-value值,顯著性檢驗等。

下面是**與注釋講解:

csvpath

)csvpath

dfdfx])y

])xy

plot(y~x+1)

jhy1+x)

#建立線性回歸模型

jhyxm

#呼叫mean函式求均值

xmplot(y~x+1)

# 繪製回歸線

abline(jhy)

#繪製擬合直線

#統計結果

#> summary(jhy) #統計結果

#call:

# lm(formula = y ~ 1 + x)

#residuals:

# min 1q median 3q max

#-6.0867 -1.1916 -0.9292 3.7559 4.5430

#coefficients:

# estimate std. error t value pr(>|t|)

#(intercept) 362.2343 590.1104 0.614 0.545

#x 0.9790 0.0418 23.419 <2e-16 ***

# ---

# signif. codes: 0 『***』 0.001 『**』 0.01 『*』 0.05 『.』 0.1 『 』 1

#residual standard error: 3.523 on 24 degrees of freedom

#multiple r-squared: 0.9581, adjusted r-squared: 0.9563

#f-statistic: 548.4 on 1 and 24 df, p-value: < 2.2e-16

#call,列出了回歸模型的公式。

#residuals,列出了殘差的最小值點,1/4分位點,中位數點,3/4分位點,最大值點。

#coefficients,表示引數估計的計算結果。

#estimate,為引數估計列。intercept行表示常數引數a的估計值 ,x行表示自變數x的引數b的估計值。

#std. error,為引數的標準差,sd(a), sd(b)

#t value,為t值,為t檢驗的值

#pr(>|t|) ,表示p-value值,用於t檢驗判定,匹配顯著性標記

#顯著性標記,***為非常顯著,**為高度顯著, **為顯著,·為不太顯著,沒有記號為不顯著。

#residual standard error,表示殘差的標準差,自由度為n-2。

#multiple r-squared,為相關係數r^2的檢驗,越接近1則越顯著。

#adjusted r-squared,為相關係數的修正係數,解決多元回歸自變數越多,判定係數r^2越大的問題。

#f-statistic,表示f統計量,自由度為(1,n-2),p-value:用於f檢驗判定,匹配顯著性標記。

residuals

#計算殘差

residuals

shapiro.test(residuals)

#正態分佈檢驗

plot(residuals)

#畫出殘差圖

,]#檢視第7,9,11列資料 因為這幾列在幾個圖中同時出現

wmjdf2

-c(7,11

,19),

]#去掉第7,9,11列資料

df2x2

])#重新建立回歸建模和顯著性檢驗

y2])

lm.ab2

1+x2)

summary(lm.ab2)

new15440

)#設定值

newlm.pred

"prediction"

,level=

0.95

)#對設定的值進行**

lm.pred

以上為記錄

R語言 一元線性回歸

一元線性回歸的基本步驟 1.載入資料 給出散點圖 x plot x,y 2.線性回歸 得到回歸方程 並檢視回歸結果 所得回歸方程為y 130.83x 28.49 3.線性擬合 abline cg 新增擬合直線 4.x0 0.16時相應y的概率為0.95的 區間 x0 pred prediction ...

使用R語言進行一元回歸

我們通過乙個例子來介紹通過r語言進行一元回歸的方法 例子 為研究某實驗過程中,溫度x 對產品得率 的影響,測得資料如下 溫度x 100110 120130 140150 160170 180190 得率y 4551 5461 6670 7478 8589 說明 該例子來自盛驟等老師編寫的第四版概率論...

用R語言學習資料探勘 8 一元線性回歸

若有如下資料 部分資料 做出散點圖直觀觀察 可以看出x和y基本符合乙個線性關係。我們可以認為y與x的關係基本上是線性的,而這些點與直線的偏離是由其他一切不確定因素的影響造成的,為此可以做如下假定 y 0 1x 其中,0 1x 表示y隨x的變化而線性變化的部分 是隨機誤差 它是其他一切不確定因素影響的...