1.資料降維
資料降維的動力主要來自資料壓縮和資料視覺化。下圖中的資料雖然是在乙個三維空間裡,但是用乙個二維的平面基本上就是可以描述出來的,所以我們可以把資料降到二維。
2.pca演算法
第一步是均值歸一化。我們需要計算出所有特徵的均值,然後令 。如果特徵是在不同的數量級上,我們還需要將其除以標準差 。
第二步是計算協方差矩陣(covariance matrix):
第三步是計算協方差矩陣的特徵向量(eigenvectors):
如果我們希望將資料從維降至維,我們只需要從中選取前個向量,獲得乙個維度的矩陣,我們用表示,然後通過如下計算獲得要求的新特徵向量:
下面這個鏈結有pca詳細的推導和證明:
吳恩達機器學習ex7 PCA降維
主成分分析 principal component analysis,pca 1 樣本 1.1 樣本資料集 匯入乙個二維的資料集並顯示,得到。1.2 執行pca演算法 pca演算法包括如下幾個部分 對原始資料進行歸一化 其歸一化的演算法為x x mu sigma,其中mu為資料的均值,sigma為資...
吳恩達機器學習筆記 15 降維
本章重點講述了降維方法以及其中最主要的pca主成分分析的原理 使用 降維的第乙個作用就是進行資料的壓縮,解決磁碟和計算的問題。比如把二維資料降維到一維 或者資料從三維降維到2維。降維的另乙個作用就是進行視覺化,比如我們的資料有很多維度,如果想要在圖形上展示各個資料,分析其關係是很難的。那麼就可以把資...
吳恩達機器學習筆記
為了解決實際生活中的問題,我們通常需要乙個數學模型。比如,小明有乙個房子 他想賣掉房子 為了知道房子的 小明收集了該地區近兩年的房屋交易 他發現房屋 與房屋大小呈正相關,所以他畫了了一幅圖 小明的房屋大小用紅色的 代替。可見和小明房屋一樣大小的房子並不存在,而類似的房屋 又有很大差別,如此小明決定用...