最近做回歸分析,出現了相關係數與回歸方程係數符號相反的問題,經過研究,確認是多重共線性問題並探索了解決方法。
解釋變數理論上的高度相關與觀測值高度相關沒有必然關係,有可能兩個解釋變數理論上高度相關,但觀測值未必高度相關,反之亦然。所以多重共線性本質上是資料問題。
造成多重共線性的原因有一下幾種:
1、解釋變數都享有共同的時間趨勢;
2、乙個解釋變數是另乙個的滯後,二者往往遵循乙個趨勢;
3、由於資料收集的基礎不夠寬,某些解釋變數可能會一起變動;
4、某些解釋變數間存在某種近似的線性關係;
判別:1、發現係數估計值的符號不對;
2、某些重要的解釋變數t值低,而r方不低
3、當一不太重要的解釋變數被刪除後,回歸結果顯著變化;
檢驗;1、相關性分析,相關係數高於0.8,表明存在多重共線性;但相關係數低,並不能表示不存在多重共線性;
2、vif檢驗;
3、條件係數檢驗;
解決方法:
1、增加資料;
2、對模型施加某些約束條件;
3、刪除乙個或幾個共線變數;
4、將模型適當變形;
5、主成分回歸
處理多重共線性的原則:
1、 多重共線性是普遍存在的,輕微的多重共線性問題可不採取措施;
2、 嚴重的多重共線性問題,一般可根據經驗或通過分析回歸結果發現。如影響係數符號,重要的解釋變數t值很低。要根據不同情況採取必要措施。
3、 如果模型僅用於**,則只要擬合程度好,可不處理多重共線性問題,存在多重共線性的模型用於**時,往往不影響**結果;
以上是摘抄《計量經濟學中級教程》潘省初主編
多重共線性
多重共線性的概念 模型解釋變數之間存在完全線性相關或不完全線性相關關係 產生的原因 1 特徵變數之間的內在聯絡 2 特徵變數在時間上有同方向變動的趨勢 3 某些變數的滯後 檢驗的方法 1 相關性分析 2 方差膨脹因子 方差膨脹因子 variance inflation factor,vif 容忍度的...
r語言多重共線性 統計基礎 多重共線性
僅用於個人學習知識整理和sas r語言 python 整理 該文章首發於csdn 正在遷移優化文章中 1.定義 則稱自變數間存在完全多重共線性 2.影響 3.診斷 另外找到乙個比較詳細的診斷方法的列舉 線性回歸多重共線性的診斷方法和r語言實現 線性回歸多重共線性的診斷方法和r語言實現 資料分析與資料...
R語言 資料分析 多重共線性問題
1 什麼是多重共線性?多重共線性 multicollinearity 是指線性回歸模型中的解釋變數之間由於存在精確相關關係或高度相關關係而使模型估計失真或難以估計準確。2 多重共線性對回歸模型的影響 1 完全共線性下引數估計量不存在 2 近似共線性下ols估計量非有效 3 引數估計量經濟含義不合理 ...