因子分析資料 統計學學習之路 因子分析學習分享

2021-10-12 17:14:52 字數 2740 閱讀 3947

因子分析(降維)

1.、為什麼做因子分析:實際門店問題中,往往我們會選擇潛力最大的門店作為領航店,以此為樣板,實現業績和利潤的突破及未來新店的標桿。那麼,選擇領航店過程中我們要注重很多因素,比如所在小區的房價,總面積,戶主年齡分布、小區戶數、門店面積,2公里範圍內競爭門店數量等。收集到所有的這些資料雖然能夠全面、精準的確定領航店的入選標準,但實際建模時這些變數未必能夠發揮出預期的作用。主要體現兩方面:計算量的問題;變數間的相關性問題。

2、解決方法:最簡單直接的方案就是削減變數個數,確定主要變數,但這會導致資訊不全面的問題,因子分析以最少的資訊丟失為前提,將眾多的原有變數綜合成少數的綜合指標,名為因子。

3、因子分析特點:因子個數遠小於變數個數;能夠反應原變數的絕大數資訊;因子之間的線性關係不顯著;因子具有命名解釋性

4、因子分析步驟:一、原有變數是否能夠進行因子分析;二、提取因子;三、因子的命名解釋;四、計算因子得分;五、綜合評價

5、因子分析的數學模型:

x1=a11f1+a12f2+a13f3+---+a1kfk

x2=a21f1+a22f2+a23f3+---+a2kfk

-

-

-

xp=ap1f1+ap2f2+ap3f3+---+apkfk

6、應用舉例:

收集到18年全國31個省市自治區各類經濟單位,包括國有經濟單位、集體經濟單位,聯營經濟單位、股份制經濟單位和其他經濟單位的人均年收入資料,現對全國各地區人均年收入的差異性和相似性進行研究。

一、考察原有變數是否適合進行因子分析。

kmo值為0.882,接近1,說明變數相關性很強(越接近1越強)

從巴特利特球度檢驗看,假設相關係數矩陣與單位陣無顯著差異。p值接近0,若顯著性水平為0.05,p<0,則拒絕原假設,認為相關係數矩陣與單位陣有顯著差異。

經檢測原有變數間有相關性關係,可以進行因子分析。

二、提取因子

根據原有變數的相關係數矩陣,採用主 成分分析法提取因子並選取大於1的特徵值(某一因子載荷的平方和及因子的方差)。

有三個經濟單位變數的資訊缺失較為嚴重(金40%)。

重新指定提取標準,提取2個因子。

由上圖可知,所有變數的共同度均較高,因子提取的效果較理想。

單位1=0.955f1-0.095f2

單位2=0.923fi+0.057f2

三、因子的命名解釋

對因子載荷矩陣實行正交旋轉(載荷矩陣*正交向量),使因子具有命名解釋性。

第乙個因子主要解釋內部投資經濟單位

第二個因子主要解釋外來投資經濟單位

四、計算因子得分

採用回歸估計法估計因子得分係數

f1=0.223+國有+0.196集體+0.656聯營+0.331股份-0.062外商+0.020港澳台-0.519其他

f2=-0.002國有+------

計算兩個因子得分時,聯營經濟單位和其他經濟單位的權重較高,方向相反,與因子的實際意義相吻合。另外、因子得分的均值為0。正值表示高於平均水平,負值表示低於平均水平。

五、綜合評價

得出結論1:北京第2因子得分最高,表示外來投資經濟單位人均收入遠高於其他省份,第1因子得分在平均值附近,表明內部投資經濟單位的人均年收入與其他地區的差異不大,處於平均水平。

其次,對各地區人均年收入進行綜合評價。以兩個因子的方差貢獻率為權數。

f=0.45/(0.45+0.39)*f1+0.39/(0.45+0.39)f2

得出結論2:人均收入較高的省份是北京、上海、廣東等,多屬經濟文化中心或東南沿海地區。人均收入較低的省區有內蒙古。山西。青海等,多數內陸或西北邊遠地區。

職場小白,學習分享,如有問題,歡迎指正!

資料統計作業0429 因子分析 FA

僅供自己記錄用途 2020年4月29日星期三 7.1,7.2.1 因子分析 fa 1.在因子分析 fa 中,解釋潛變數 公共因子 特殊變數和載荷 係數 2.你認為fa和pca 主成分分析 的主要區別有哪些?因子分析如同主成分分析 pca 一樣也是一種降維的方法,其思想與pca也是相似的。它們最直觀的...

資料分析五 因子分析

因子分析是將多個實測變數轉換為少數幾個綜合指標 或稱潛變數 主要用於尋找資料的內在邏輯和降維。在本課節中,老師從應用因子分析的情境出發,經過方差共同度分析 主成分分析,深入淺出地解析獲取公因子的過程,拔高學員的資料處理能力。本節課包括以下知識點 是否遺漏 是否有方差,是否有方差的丟失 和的方差能夠變...

資料預處理系列 (十)用因子分析降維

博主簡介 風雪夜歸子 英文名 allen 機器學習演算法攻城獅,喜愛鑽研machine learning的黑科技,對deep learning和artificial intelligence充滿興趣,經常關注kaggle資料探勘競賽平台,對資料 machine learning和artificial...