主要步驟:
將資料存成csv格式,逗號分隔 在r中,讀取資料,然後將資料轉成矩陣形式 載入lars包,先安裝 呼叫lars函式 確定cp值最小的步數
確定篩選出的變數,並計算回歸係數
具體**如下:
需要注意的地方:
1、資料讀取的方法,這裡用的file.choose( ),這樣做的好處是,會彈出視窗讓你選擇你要載入進來的檔案,免去了輸入路徑的苦惱。
2、資料要轉為矩陣形式
3、(la) 可以看到r方,這裡為0.66,略低
4、圖如何看? summary的結果裡,第1步是cp最小的,在圖里,看到第1步與橫軸0.0的交界處,只有變數1是非0的。所以篩選出的是nongyangungun
ps: r語言只學習了資料輸入,及一些簡單的處理,圖形視覺化部分尚未學習,等**寫完了,再把這部分認真學習一下~~在這裡立個flag
向量自回歸模型(VAR)及其R語言實現
自行google,很詳細,也很簡單 主要是 分析和內生變數間影響狀況分析。個人拙見,不是標準模板 選擇合適的變數 granger因果檢驗,進一步觀察變數間的關聯性,最好做雙向檢驗,不過也有人說單向就足夠了,這就人之間人智者見智了 選擇var模型滯後階數 擬合var模型 脈衝響應分析 方差分解 分析 ...
多元線性回歸公式推導及R語言實現
實際中有很多問題是乙個因變數與多個自變數成線性相關,我們可以用乙個多元線性回歸方程來表示。為了方便計算,我們將上式寫成矩陣形式 y xw 我們希望求出的w是最接近線性方程的解的,最接近我們定義為殘差平方和最小,殘差的公式和殘差平方和的公式如下 上面的公式用最小殘差平方和的方式匯出的,還有一種思路用最...
R語言實現KNN 演算法
knn是機器學習中最簡單的分類演算法之一 就是把每乙個測試樣本跟訓練樣本中的每乙個樣本求他們的歐式距離,然後選出最小的幾個,裡面哪乙個類多 這個測試樣本就屬於哪乙個類 用r語言自帶的iris 寫了一下 data iris length iris 1 idx sample 150,100 train ...