data<-data.frame() #資料框的構建
異常值診斷
```r
y=c(160,260,210,265,240,220,275,160,275,250)
x1=c(70,75,65,74,72,68,78,66,70,65)
x2=c(35,40,40,42,38,45,42,36,44,42)
x3=c(1,2.4,2,3,1.2,1.5,4,2,3.2,3)
shuju<-data.frame(y,x1,x2,x3)
shuju
lm1=lm(y~.,data=shuju)#(2)求三元線性回歸方程(3)擬合優度檢驗
summary(lm1)
#異常值與強影響點
#殘差
shuju.stdres<-rstudent(lm1);
#中心化槓桿值
ch<-hatvalues(lm1)-1/10;
#cook距離
shuju.cooks<-cooks.distance(lm1);
#找異常值
isoutlier<-abs(shuju.stdres)>3;
isoutlier #殘差選擇正負3倍標準差以外的
isch<-ch>2*1/10;
isch #槓桿值大於兩倍的hba
iscooks<-shuju.cooks>1;
iscooks #庫克距離大於1的
r語言進行box-cox轉換:
library(mass)
b <- boxcox(y ~ x1 + x2 + x3 + x4, data=data)
blambda <- b$x
lik <- b$y
bc <- cbind(lambda, lik)
bc[order(
-lik),]
#結果λ=-0.3時lik值最大,因此λ取值-0.3
R語言 觀測異常值並改進
全面的回歸分析包括對異常值的分析 離群點 高槓桿值點 強影響點。離群點 模型效果不佳的觀測點。使用car包中的outliertest 函式,可以求得最大標準化殘差絕對值bonferroni調整後的p值,若不顯著,則說明資料集中沒有離群點,若顯著,則必須刪除該離群點。可見,在這個回歸模型中 nevad...
R中異常值檢測
data1 complete.cases selectdata 布林判斷 true代表1,false代表0 sum complete.cases selectdata 完整資料200條 sum complete.cases selectdata 不完整資料1條 mean complete.cases...
R語言回歸分析中的異常值點的介紹
1 離群點 如何識別離群點?1 q q圖,落在置信區間帶外的點即可被認為是離群點。2 乙個粗糙的判斷準則 標準化殘差值大於2或者小於2的點可能是離群 3 library car outliertest fit 顯示離群點 rstudent unadjusted p value bonferonni ...