R語言主成分分析

2021-08-07 09:49:40 字數 1392 閱讀 4794

head(swiss)#檢視資料

cor(swiss)#檢視相關性矩陣

方陣中絕對值最小的是0.06085861,比0.05大,因此swiss中變數相互之間均有或強或弱的相關關係,這份資料適合做主成份分析。

由於變數的量綱不同會使主成份得分係數的可解釋性變差,使結果受到量綱大的變數影響,而忽略量綱較小的變數,所以對資料進行標準化,使每個變數都服從均值為0,方差為1的正態分佈

其中importance of components中的standard deviation行給出了6個主成分的標準差;proportion of variance行給出了主成份的方差貢獻率;cumulative proportion行給出了方差累計貢獻率。

方差貢獻率用於體現每個主成分對原始資料中資訊的解釋能力。第乙個主成分的方差貢獻率是0.5332928,即第乙個主成分能夠解釋原資料中53.32%的資訊,第二個主成分能解釋原資料19.8%的資訊,....,六個加起來解釋能力為百分之百

由於loadings設定為真,所以r同時返回各個主成分對應的係數,根據給出的係數,列出兩個主成分的表示式:

y2=0.300*fer-0.412*agr+0.125*exa+0.179*rdu+0.146*cat+0.811*inf

y1=-0.457*fer-0.424*agr+0.51*exa+0.454*edu-0.35*cat-0.15*inf

screeplot(p,type='lines')#畫出碎石圖

從圖中可以看出,從第四個變數之後,斜率開始趨於0,所以,主成分取2~4個是比較合適的

prehead(pre)

yyy1

y2y3

y4scores

head(scores)#將主成分得分與樣本資料的特徵向量做內積可得綜合得分,由於前四個變數可解釋資料的大部分資訊,故選前四個為主成分計算

courtelary城市得分最高,franches-mnt得分最低,故前者發展的最好,後者最差

主成分分析 R語言

主成分分析 principal component analysis,pca 是一種統計方法。通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。原理 在用統計分析方法研究多變數的課題時,變數個數太多就會增加課題的複雜性。人們自然希望變數個數較少而得到的資訊較...

R 主成分分析

一 實驗內容 基本思想 通過降維技術把多個變數化為幾個少數主成分的方法,即將原來眾多具有一定相關性的指標,重新組合成一組新的相互無關的綜合指標。表示形式 結論 1 uij為第i個成分yi和第j個原先的變數xj之間的線性係數 2 y1,y2,yp分別叫做第1主成分,第2主成分,第p主成分,y1得到最大...

R語言 PCA 主成分分析)

1 關鍵點 綜述 主成分分析 因子分析 典型相關分析,三種方法的共同點主要是用來對資料降維處理的從資料中提取某些公共部分,然後對這些公共部分進行分析和處理。主成分分析 是將多指標化為少數幾個綜合指標的一種統計分析方法 主成分分析是一種通過降維技術把多個變數化成少數幾個主成分的方法,這些主成分能夠反映...