線性模型
擬合模型
用lm()
函式擬合模型。
lm(formula = y ~ x1+x2+x3+...+xn,data)
formula:y是響應變數,x是**變數。
指定模型的工具函式(1)如果想在表示表示式字面上的含義而不是公式的含義,用恒等函式i()
。
獲取模型資訊
(1)首選用print()
檢視模型資訊的首選方法。
(2)利用formula(x)
函式顯示擬合模型的公式。
(3)利用coef(x)
函式顯示模型物件係數的列表。
(4)利用summary(x)
函式彙總線性模型的資訊。
使用模型進行**
(1)使用residuals(x)
函式獲得殘差向量。殘差是實際值與**值的差。
(2)使用fitted(x)
函式獲取擬合模型的**值。
(3)想用建立的擬合模型對新的資料集進行擬合,可以用predict()
函式。
predict(object,newdata,na.action = na.pass)
object:擬合模型
newdata:用來**的新資料來源
na.action:表示如何處理newdata中的na值。
分析擬合結果(1)計算擬合模型各個變數的置信區間:confint()
函式
conflint(object,parm,level = 0.95)
object :擬合的線性模型
parm:指定需要顯示的變數。預設顯示所有變數的置信區間。
level:指定置信水平。
(2)計算不同引數對響應變數的影響:influence.measures(model)
(3)獲取方差分析的統計量:anova.lmlist
anova.lmlist(object,scale = 0,test = 'f')
scale:缺省會從檢驗資料中計算乙個估計值
test:預設進行f檢驗;指定'chisq'進行卡方檢驗;指定'cp'的cp檢驗。
(4)獲取線性模型物件的方差協方差矩陣:vcov(object)
(5)獲取你和模型的離差(殘差平方總和):deviance(object)
更新模型使用update()
函式來更新模型。
update(object,formula = +0)
object:原擬合模型。
formula:公式中新增0作為變數表示不包含截距項。
最小二乘法的假設
1.方差齊性
定義:誤差項的平方是常數值。
檢驗:進行ncvtest函式來檢驗異方差性ncv.test(object)
2.非自相關性
3.誤差項服從正態分佈
4.x的外生性
定義:對於所有x來說,誤差線的期望值為0.
5.滿秩
定義:任何一對**變數之間都沒有線性關係。
檢驗:在lm
函式中設定引數singular.ok = false
穩健回歸和線性回歸
穩健回歸
適用:存在異方差和異常值的資料。
方法:mass
包的rlm()
函式
rlm(formula,data,method)
阻力回歸適用:包含異常值的資料。使用最小中位數平方和最小截平方的方法。
方法:mass
包的lqs()
函式
lqs(formula,data,method)
子集選取和shrinkage回歸
變數的逐步選取
反覆對模型新增和移除變數,試圖逐步改善模型。當到頭時會自動停止並返回乙個新的模型。在這個過程中降低了rss增加了模型的複雜度。aic被從來度量新增的變數效果。aic = -2 * log(l) + k * edf
優先考慮的模型應是aic值最小的那乙個
step(object,scale = 0,direction,steps = 1000,k = 2)
direction:指定'forward'意味變數僅僅被新增到模型;指定 'backward'意味變數僅僅從模型中移除;指定'both'意味著兩者皆有。
steps:在函式中之前的最大迭代步。
嶺回歸嶺回歸適用於**變數之間存在相關性的資料(多重共線性)。
使用mass
包中的lm.ridge()
函式
lm.ridge(formula,data)
lassolasso回歸用於減少係數數目,從而減少它們對最終模型的影響。
lars
包中的lars()
函式
lars(x,y,type = "lasso")
x:**變數矩陣
y:響應變數的向量
第20回 測試風險的管理
2006年10月26日 12 39 00 測試風險是不可避免的 總是存在的,所以對測試風險的管理非常重要,必須盡力降低測試中所存在的風險,最大程度地保證質量和滿足客戶的需求。在測試工作中,主要的風險有 質量需求或產品的特性理解不準確,造成測試範圍分析的誤差,結果某些地方始終測試不到或驗證的標準不對 ...
2005 10 20回到武漢20天小結
回到武漢的已經是20天了,但是,我每天還是沒有做到看 寫 除了是四處參加一些大公司的宣講會,還有就是看一些低階趣味的文章,灌水發帖子,沒有紮實的練習基本功,以前的同事說,他的那個公司專案經理打算招人,讓我過去看看,但是我自己的底子自己清楚,推說自己要搞 其實 這幾天加班加點已經寫好了,就是沒有和導師...
7 8 回形針,yyds! 20分
輸入格式 一行字串,長度不超過104 輸出格式 將輸入的字串以螺旋狀輸出,使得輸出呈現乙個正方形 行數 每行字元數 要求該正方形在大小足以容納該字串的前提下盡可能小。若按指定方式填充後該正方形內有空缺,則空缺部分以空格填補。輸出從左上角開始向右行進,遇到拐角即右轉 輸入樣例 this is a te...