線性回歸的分析思路
2.準備工作——自變數變換
3.單因素分析
4.多因素分析
5.模型評價——模型對實際資料的擬合效果評價
6.模型診斷
共線性診斷指標
異常點診斷
高槓桿點
強影響點
7.模型修飾及在評價
8.建立模型
/*簡單散點圖*/
proc sgplot;
scatter x= y=;
run;
/*偏殘差圖*/
proc reg;
model y=自變數/partial;/*partial 為校正變數,可輸出綜合效應*/
run;
2.利用box-cox變換 ——主要是對因變數進行變換
如何確定哪種變數變換方式更好
判斷異方差的方法
2.散點圖
3.white檢驗
加權最小二乘法的sas實現
偏最小二乘回歸的sas實現
data fh;
input height weight cir xin;
cards;
95 14 54 50
92 13 52 42
89 13 53 36
158 52 79 99
119 20 55 68
113 18 53 61
125 22 59 67
91 14 48 36
93 13 50 44
92 11 53 32
154 55 80 95
163 54 82 87
130 25 59 63
98 17 51 51
99 15 51 54
;proc reg;
model xin=height weight cir/collin tol vif;
run;
proc pls cv=one method=pls cvtest;
/*呼叫pls程式*/
/* cv=one 表示採用捨一法進行交叉確認
/* method=pls 表示採用偏最小二乘回歸法提取因子
/* cvtest 表示對留一交叉確認進行統計學檢驗。*/
model xin=height weight cir/solution;
/*solution 選項給出模型的回歸係數,包括中心化係數和原始變數係數*/
run;
應用場景
常用估計方法
sas程式實現
data example7_10;
input x y;
cards;
6.8 746
7.8 553
8.7 562
8.7 563
8.9 570
19.5 575
10.1 581
10.2 605
10.3 607
10.4 621
11.1 624
12.4 626
13.3 632
13.1 640
13.2 656
;proc sgplot; /*畫散點圖*/
scatter x=x y=y;
run;
proc reg;
model y=x/r influence;/*異常點的檢測*/
run;
proc robustreg method=mm;
/*呼叫穩健回歸命令,方法選擇mm估計*/
model y=x/diagnostics leverage;
/*對變數進行異常點和槓桿點診斷*/
run;
1.應用場景
2.sas語句
應用條件
應用判斷方式
特點
非線性回歸
自變數與因變數關係不滿足線性的時候
散點圖/偏殘差圖
需根據經驗判斷 或利用box-cox變換對變數進行轉換
加權最小二乘回歸
不同x值所對應的方差隨著變大或減少時
1.殘差圖 2.white檢驗:當p<0.05,可以拒絕方差齊性的無效假設,認為方差不齊
已知方差時可直接用方差的倒數作為權重,未知時,可用殘差絕對值或平方的倒數作為權重
偏最小二乘回歸
容忍度(tolerance)均小於0.1,方差擴大因子(variance inflation)均大於10,條件指數有兩個大於30
適用於存在嚴重相關性和存在多重共線性的資料;集主成分分析、典型相關分析和多元線性回歸分析3種分析方法的優點於一身;可以避免資料非正態分佈、因子結構不確定性 和模型不能識別等潛在問題
穩健回歸
有異常點的情況
離群點(穩健殘差) 高槓桿點(穩健mcd距離) 強影響點
最小二乘估計條件不滿足時,其結果優於最小二乘估計;m估計和mm估計等估計的運用;對於不同的資料賦予不同的權重
分位數回歸
模型殘差不滿足正態性,需要得到不同分位數下的回歸模型時
殘差的正態概率圖或殘差的正態性檢驗。
全面的描述被解釋變數條件分布;估計結果對離群值則表現的更加穩健,而且對誤差項並不要求很強的假設條件,更適用於非正態分佈
我的linux菜鳥之路2
發現昨天寫的學習內容像是小學時候寫的流水賬,而且沒有層次感,這次換一種寫法。總結一下今天學到的命令 1.su 這個命令是用來公升級使用者的許可權,普通使用者通過密碼就能將許可權提公升為root 2.ls al ls就是list的縮寫,用於顯示檔案的檔名與相關屬性,選項 al就是列出檔案詳細的許可權和...
我的linux菜鳥之路3
進行看書學習了與檔案與目錄管理有關的若干命令,感嘆一下,真是多,一遍看下來記不住幾個。代表此層目錄 代表上一層目錄 代表前乙個工作目錄 代表當前使用者所在的家目錄 account 代表account這個使用者的家目錄 account是個賬號名稱 1.cd命令 變換目錄的指令,change direc...
菜鳥的學習之路(9) ArrayList類
一.認識arraylist 1.arraylist是乙個動態的陣列 集合 可以在生成後對其中的內容進行增刪改。相對於array 靜態陣列 使用更靈活,可以對其內容進行修改。2.實現的介面是collection 和iterable list randomaccess cloneable seriali...