mlpy庫-----降維模組(學習筆記)
1、降維(dimensionality reduction) 2、
主成分分析
(pca)
定義:class mlpy.pca(method='svd', whiten=false)
引數:成員函式:
(1)coeff()
返回對映矩陣 (p,l),其中 l=min(n,p),按特徵值降序排列. 每一列包含乙個主成分的係數。
(2)coeff_inv()
返回對映矩陣(l,p)的逆, 其中l=min(n,p), 按特徵值降序排列.
(3)evals()
返回排序特徵值 (l), 其中l=min(n,p).
(4)learn(x)
計算主成分係數。x 是乙個矩陣 (n,p)。x的每一列表示乙個變數,而行包含觀測。
(5)transform(t, k=none)
把t (m,p)嵌入k維子空間。返回乙個(m,k)矩陣。 如果 k =none將被設為min(n,p)。
(6)transform_inv(z)
把資料變換到原來的空間,其中z是乙個(m,k)矩陣。返回乙個 (m,p)矩陣。
3、快速主成分分析 (pcafast)
定義:class mlpy.pcafast(k=2, eps=0.01)
引數:
k [integer] the number of principal axes or eigenvectors required
eps [float (> 0)] tolerance error
函式:
(1)coeff()
按特徵值降序排列返回變換矩陣(p,k)。 每一列包含乙個主成分的係數。
(2)coeff_inv()
返回變換矩陣(k,p)的逆,按特徵值降序排列。
(3)learn(x)
計算第乙個k主成分係數。
x是乙個矩陣(
n,p)。
x 的每一列代表乙個變數,而行包含 觀察值。
(4)transform(t)
把 t (m,p)嵌入到 k維子空間中,返回乙個(m,k)矩陣。
(5)transform_inv(z)
把資料變換到原來的空間,其中z是乙個(m,k)矩陣。返回乙個 (m,p)矩陣。
資料降維PCA 學習筆記
pca降維。基於方差降維,屬於無監督學習。無需資料標籤。使方差 資料離散量 最大,變換後資料分開。更易於分類。可以對隱私資料pca,資料加密。基變換投影 內積 正交的基,兩個向量垂直 內積為0,線性無關 先將基化成各維度下的單位向量。一般把資料寫成列向量的形式,新的基寫成矩陣的形式。基 向量 基要在...
筆記 PCA降維
作為乙個非監督學習的降維方法,pca principal components analysis 顧名思義,就是找出資料裡最主要的方面,用資料裡最主要的方面來代替原始資料。具體的,假如我們的資料集是n維的,共有m個資料 x1,x2,xm 我們希望將這m個資料的維度從n維降到k維,希望這m個k維的資料...
機器學習筆記十一之降維
我們可以先令?1,然後進行主要成分分析,獲得?和?然後計算比例是否小於 1 如果不是的話再令?2,如此類推,直到找到可以使得比例小於 1 的最小?值 原因 是各個特徵之間通常情況存在某種相關性 還有更好的方式來選擇k,通過奇異值分解得到 u,s,v 三個引數,5 重建的壓縮表示 在那裡你可能需要把 ...