PCoA主座標分析

2021-09-27 17:31:08 字數 1285 閱讀 8106

這是一種排序方法。假設我們對n個樣方有了衡量它們之間差異即距離的資料,就可以用此方法找出乙個直角座標系(最多n-1維),使n個樣方表示成n個點,而使點間的歐氏距離的平方正好等於原來的差異資料。

由於樣方間的差異資料可以由各種方式給出,只要對一些差異進行定量描述,如甲型,乙型,丙型等,就可以求出樣方的數量座標,實現定性到定量的轉變。

主座標方法簡單、明確、效率很高。它與主分量分析一樣,最後找出的座標系不僅正交, 而且第一軸、第二軸……依次按n個點在該軸上的方差大小順序排列,n個點對不同兩個軸都不相關。所以也可用較少的維數,特別是直觀的

二、三維空間去排列樣方,而使資訊的損失最少。

它與主分量分析不同之處在於:不是先給出n個點的座標,去找出剛性旋轉的座標;而是只知其間的距離要去重新建立各點的座標。因此可以不限於度量(metrtic)的相似係數公式,pernitec(1977)採用數量資料對於寒溫帶森林和草地進行主座標分析,他認為非度量(non-mertic)相似係數比度量相似係數效果更佳。

1           構成差異矩陣m

2           構成離差距陣a

就求出a矩陣的元素。以後可知,它是最後求出的n個樣方點座標矩陣的離差矩陣。這裡不必證明而列出a具有的三個性質:

1,  a是對稱的,即aij~aji(i,j=1,2,……,n)

2,  a的行和及列和均等於0,即ai.=a.i=0;

3,  mij2=mji2=aii+ajj-2aij( i,j=1,2,……,n).

3           求出n個樣方的座標矩陣c

因為a是nxn的對稱實矩陣,所以必存在著酉矩陣(正交矩陣)u將a變換成對角矩b,即 uau』=b,或a=u』bu。其中b的主對角線元素為λ1, λ2,……λn,分別 是a的n個依大小排 列的特徵根,而u的每一行向量是相應的特徵向量。

4           排列n個樣方

根據c給出的n個樣方的座標值,可以在s維空間中排列樣方,而不損失資訊。 與主分量分析一 樣 , 可以在較低k(< s)維空間中排列樣方, 則保留的資訊百分比為 :

主成分分析

主成分分析 pca 分析乙個隨機向量的中的主成分 主成分一般不是隨機向量中的某乙個分量,而是不同分量的線性組合,根據資訊理論的觀點,資訊的多少與方差有關,所以 主成分是方差最大的幾個成分 主成分分析的方法是求隨機向量的協方差矩陣 用樣本協方差矩陣代替 對於差異較大的資料,可採用相關矩陣代替協方差矩陣...

主成分分析

理論要點 1 主成分分析是一種無監督學習,因此不能用交叉驗證來檢驗誤差 2 在處理資料之前,要對資料做中心化處理 3 p太大的話,做特徵分解用svd 4 一共有min n 1,p 個主成分,因為中心化以後,rank要降一維 5 主成分的載荷向量就是協方差矩陣的特徵向量,對應特徵值最大的是第一主成分,...

主成分分析

1.概念 將一組可能存在相關性的隨機變數轉變成互不相關的隨機變數。這個概念裡有三個地方需要理解清楚。1 隨機變數的指代 在資料集中,每乙個樣本,即將資料集理解成乙個 的話,乙個樣本就是一行,則每一列就是乙個特徵,也就是乙個隨機變數,一列的所有取值就是隨機變數的所有可能取值 說的所有可能取值只針對訓練...