因子分析原理

2021-07-30 10:37:19 字數 1252 閱讀 1270

因子分析是根據相關性大小把原始變數進行分組,使得同組內的變數之間相關性較高,而不同組的變數間的相關性則較低。每組變數代表乙個基本結構,並用乙個不可觀測的綜合變數表示,這個基本結構就稱為公共因子。

先介紹一下因子分析的數學模型,如下:

因子模型(正交因子模型):

1) 確定待分析的原有若干變數是否適合進行因子分析

因子分析是從眾多的原始變數中重構少數幾個具有代表意義的因子變數的過程。其潛在的要求:原有變數之間要具有比較強的相關性。因此,因子分析需要先進行相關性分析,計算原始變數之間的相關係數矩陣。進行原始變數的相關分析之前,需要對輸入的原始資料進行標準化計算。

相關係數的值介於-1與1之間,即-1<= r <=1.其性質如下:

公因子個數的確定準則:根據因子的累積方差貢獻率來確定,一般取累積貢獻率大於85%的特徵值所對應的第

一、第二、…、第m(m<=p)個主成分。

3) 因子變數的命名解釋

因子載荷矩陣a

因子變數的命名解釋是因子分析的另乙個核心問題,在實際的應用分析中,主要通過對因子載荷矩陣進行分析,得到因子變數和原有變數之間的關係,從而對新的因子變數進行命名。有時因子載荷矩陣的解釋性不太好,通常需要進行因子旋轉,使原有因子變數更具有可解釋性。因子旋轉的主要方法:正交旋轉、斜交旋轉。方差最大正交旋轉最為常用,基本思想是使公共因子的相對負荷的方差之和最大,且保持原公共因子的正交性和公共方差總和不變。可使每個因子上的具有最大載荷的變數數最小,因此可以簡化對因子的解釋。

4) 計算因子變數得分

因子變數確定以後,對於每乙個樣本資料,我們希望得到它們在不同因子上的具體資料值,即因子得分。估計因子得分的方法主要有:回歸法、bartlette法等。計算因子得分應首先將因子變數表示為原始變數的線性組合。即:

回歸法,即thomson法:得分是由貝葉斯bayes思想匯出的,得到的因子得分是有偏的,但計算結果誤差較小。貝葉斯(bayes)判別思想是根據先驗概率求出後驗概率,並依據後驗概率分布作出統計推斷。

bartlett法:bartlett因子得分是極大似然估計,也是加權最小二乘回歸,得到的因子得分是無偏的,但計算結果誤差較大。

因子分析 因子得分

因子分析的最後一步了,悲傷 在因子分析中,人們一般關注的重點是估計因子模型的引數 載荷矩陣 有時公共因子的估計 即所謂的因子得分 也是需要的,因子得分可以用於模型診斷,也可以作為下一步分析的原始資料。需要指出的是,因子的得分計算並不是通常意義下的引數估計,他是對不可觀測的隨機變數 取值的估計 通常可...

因子分析模板

2011a 2模板 p10 因子分析的主要步驟如下 資料標準化 由於不同重金屬元素的量綱可能不同,因此為了消除量綱對資料的影響,對所有的重金屬採用下面的公式對資料進行歸一化處理 其中2 計算協方差矩陣s 因為已經對資料進行歸一化處理,協方差的大小在一定程度上表示了個元素之間的關係,記每個區有n個取樣...

sklearn因子分析(python)

因子分析 factor analysis 是指研究從變數群中提取共性因子的統計技術,這裡的共性因子指的是不同變數之間內在的隱藏因子。例如,乙個學生的英語 資料 語文成績都很好,那麼潛在的共性因子可能是智力水平高。因此,因子分析的過程其實是尋找共性因子和個性因子並得到最優解釋的過程。因子分析有兩個核心...