主成分分析 (pca, principal component analysis)是一種數學降維方法, 利用正交變換 (orthogonal transformation)把一系列可能線性相關的變數轉換為一組線性不相關的新變數,也稱為主成分,從而利用新變數在更小的維度下展示資料的特徵。
主成分是原有變數的線性組合,其數目不多於原始變數。組合之後,相當於我們獲得了一批新的觀測資料,這些資料的含義不同於原有資料,但包含了之前資料的大部分特徵,並且有著較低的維度,便於進一步的分析。
在空間上,pca可以理解為把原始資料投射到乙個新的座標系統,第一主成分為第一座標軸,它的含義代表了原始資料中多個變數經過某種變換得到的新變數的變化區間;第二成分為第二座標軸,代表了原始資料中多個變數經過某種變換得到的第二個新變數的變化區間。這樣我們把利用原始資料解釋樣品的差異轉變為利用新變數解釋樣品的差異。
這種投射方式會有很多,為了最大限度保留對原始資料的解釋,一般會用最大方差理論或最小損失理論,使得第一主成分有著最大的方差或變異數 (就是說其能盡量多的解釋原始資料的差異);隨後的每乙個主成分都與前面的主成分正交,且有著僅次於前一主成分的最大方差 (正交簡單的理解就是兩個主成分空間夾角為90°,兩者之間無線性關聯,從而完成去冗餘操作)。
文章剩餘內容<<<<
BFS例項超詳細講解
例項參考挑戰程式設計bfs的迷宮最短路徑 include define maxn 100 using namespace std const int inf 100000000 typedef pairp 定義乙個pair型別的資料結構 char maze maxn maxn 1 定義乙個儲存輸入資...
大數除法 超詳細講解
大數除法,本人認為是我目前見過大數演算法中最難的乙個 僅僅是個人想法 它與之前的大數加法乘法減法不同,有些難理解,下面我一點一點的分析,講解一下如何去實現大數除法。首先,我們要知道除法中,存在四個常用名稱,被除數,除數,商,餘數 例如 53 8 6 餘 5 其中53 為被除數,8為除數,6為商,5為...
迴圈佇列超詳細講解
迴圈佇列 佇列是我們常見的一種資料結構,他的特點就是先進先出fifo,而常見的佇列的效能不能實現所有的空間都被合理的應用,所以就出現的了我們的迴圈佇列 在這裡插入描述 這裡我們需要先了解幾個資料的含義 class circlequeue public boolean isfull public bo...