R in a Nutsbell 20 回歸模型

2021-10-03 09:51:00 字數 3140 閱讀 3282

線性模型

擬合模型

lm()函式擬合模型。

lm(formula = y ~ x1+x2+x3+...+xn,data)

formula:y是響應變數,x是**變數。

指定模型的工具函式(1)如果想在表示表示式字面上的含義而不是公式的含義,用恒等函式i()

獲取模型資訊

(1)首選用print()檢視模型資訊的首選方法。

(2)利用formula(x)函式顯示擬合模型的公式。

(3)利用coef(x)函式顯示模型物件係數的列表。

(4)利用summary(x)函式彙總線性模型的資訊。

使用模型進行**

(1)使用residuals(x)函式獲得殘差向量。殘差是實際值與**值的差。

(2)使用fitted(x)函式獲取擬合模型的**值。

(3)想用建立的擬合模型對新的資料集進行擬合,可以用predict()函式。

predict(object,newdata,na.action = na.pass)

object:擬合模型

newdata:用來**的新資料來源

na.action:表示如何處理newdata中的na值。

分析擬合結果(1)計算擬合模型各個變數的置信區間:confint()函式

conflint(object,parm,level = 0.95)

object :擬合的線性模型

parm:指定需要顯示的變數。預設顯示所有變數的置信區間。

level:指定置信水平。

(2)計算不同引數對響應變數的影響:influence.measures(model)(3)獲取方差分析的統計量:anova.lmlist

anova.lmlist(object,scale = 0,test = 'f')

scale:缺省會從檢驗資料中計算乙個估計值

test:預設進行f檢驗;指定'chisq'進行卡方檢驗;指定'cp'的cp檢驗。

(4)獲取線性模型物件的方差協方差矩陣:vcov(object)(5)獲取你和模型的離差(殘差平方總和):deviance(object)更新模型使用update()函式來更新模型。

update(object,formula = +0)

object:原擬合模型。

formula:公式中新增0作為變數表示不包含截距項。

最小二乘法的假設

1.方差齊性

定義:誤差項的平方是常數值。

檢驗:進行ncvtest函式來檢驗異方差性ncv.test(object)

2.非自相關性

3.誤差項服從正態分佈

4.x的外生性

定義:對於所有x來說,誤差線的期望值為0.

5.滿秩

定義:任何一對**變數之間都沒有線性關係。

檢驗:在lm函式中設定引數singular.ok = false

穩健回歸和線性回歸

穩健回歸

適用:存在異方差和異常值的資料。

方法:mass包的rlm()函式

rlm(formula,data,method)
阻力回歸適用:包含異常值的資料。使用最小中位數平方和最小截平方的方法。

方法:mass包的lqs()函式

lqs(formula,data,method)
子集選取和shrinkage回歸

變數的逐步選取

反覆對模型新增和移除變數,試圖逐步改善模型。當到頭時會自動停止並返回乙個新的模型。在這個過程中降低了rss增加了模型的複雜度。aic被從來度量新增的變數效果。aic = -2 * log(l) + k * edf

優先考慮的模型應是aic值最小的那乙個

step(object,scale = 0,direction,steps = 1000,k = 2)

direction:指定'forward'意味變數僅僅被新增到模型;指定 'backward'意味變數僅僅從模型中移除;指定'both'意味著兩者皆有。

steps:在函式中之前的最大迭代步。

嶺回歸嶺回歸適用於**變數之間存在相關性的資料(多重共線性)。

使用mass包中的lm.ridge()函式

lm.ridge(formula,data)
lassolasso回歸用於減少係數數目,從而減少它們對最終模型的影響。

lars包中的lars()函式

lars(x,y,type = "lasso")

x:**變數矩陣

y:響應變數的向量

第20回 測試風險的管理

2006年10月26日 12 39 00 測試風險是不可避免的 總是存在的,所以對測試風險的管理非常重要,必須盡力降低測試中所存在的風險,最大程度地保證質量和滿足客戶的需求。在測試工作中,主要的風險有 質量需求或產品的特性理解不準確,造成測試範圍分析的誤差,結果某些地方始終測試不到或驗證的標準不對 ...

2005 10 20回到武漢20天小結

回到武漢的已經是20天了,但是,我每天還是沒有做到看 寫 除了是四處參加一些大公司的宣講會,還有就是看一些低階趣味的文章,灌水發帖子,沒有紮實的練習基本功,以前的同事說,他的那個公司專案經理打算招人,讓我過去看看,但是我自己的底子自己清楚,推說自己要搞 其實 這幾天加班加點已經寫好了,就是沒有和導師...

7 8 回形針,yyds! 20分

輸入格式 一行字串,長度不超過104 輸出格式 將輸入的字串以螺旋狀輸出,使得輸出呈現乙個正方形 行數 每行字元數 要求該正方形在大小足以容納該字串的前提下盡可能小。若按指定方式填充後該正方形內有空缺,則空缺部分以空格填補。輸出從左上角開始向右行進,遇到拐角即右轉 輸入樣例 this is a te...