乙個回歸分析的步驟:
1. 用scat x y
檢視散點圖
2. 使用適當的模型進行回歸分析ls
,估計出引數
3. 統計檢驗,包括擬合優度檢驗和模型顯著性檢驗
4. 時間序列資料要做自相關性分析,橫截面資料做異方差性檢驗
4. 檢查是否有多重共線性
5. 用結果來分析現實情況
先找到資料,巧婦難為無公尺之炊;
如果找不到資料,試著把問題放大,比如找不到電影資料,將其放大,去找旅遊業的資料
看圖,意思是看殘差曲線,如果曲線呈現了先正後負後又正,那麼很可能存在自相關性;
dw方法:
全名durbin-watson檢驗,在ls
結束以後的分析資料當中就有它,經驗上有如下的判斷方法:
1. dw<1: 存在正的自相關性
2. dw>3: 存在負的自相關性
3. 1.5 < dw < 2.5: 不相關
所以處理自相關性的目標就是要讓這個dw值盡量達到1.5和2.5之間。
一階廣義查分法:
ls y c x ar(1)
就這麼輸入即可,你會發現在這之後dw的值慢慢靠近1.5和2.5的範圍了,如果仍然未達到要求,可以用多階,在ar()
括號裡面寫2,3… 統計 相關性與自相關性
相關係數度量指的是兩個不同事件彼此之間的相互影響程度 而自相關係數度量的是同一事件在兩個不同時期之間的相關程度,形象的講就是度量自己過去的行為對自己現在的影響。自相關,也稱 序列相關。是乙個訊號於其自身在不同時間點的互相關。非正式地來說,它就是兩次觀察之間的相似度對它們之間的時間差的函式。它是找出重...
R語言相關性分析及步驟
記錄一下r語言學習過程,對於r的基礎就是基本資料型別 向量,矩陣,資料框,字串等等 庫的呼叫以及函式自定義,還需要多加學習!進入主題,今天主題是相關性分析 以下為 y c 170,175,180 定義向量 y1 c 20,25,30 y cor.test y,y1,method spearman 呼...
Pandas資料的相關性分析
本文的主要內容是基於中國大學mooc 慕課 中的 python資料分析與視覺化 課程進行整理和總結。兩個事物,表示成x和y,如何判斷他們之間的相關性?x增大,y也增大,兩個變數正相關 x增大,y減小,兩個變數負相關 x增大,y沒有明顯變化,兩個變數不相關 度量兩個資料的相關性有以下方法 方法 說明....