PCA sklearn引數詳解

2021-09-29 09:22:59 字數 1508 閱讀 1362

本篇僅針對sklearn中的pca作記錄

sklearn.decomposition.pca(n_components=none, copy=true, whiten=false)  

n_components:

意義:pca演算法中所要保留的主成分個數n,也即保留下來的特徵個數n

型別:int 或者 string,預設時預設為none,所有成分被保留。

賦值為int,比如n_components=1,將把原始資料降到乙個維度。

賦值為string,比如n_components='mle',將自動選取特徵個數n,使得滿足所要求的方差百分比。

copy:

型別:bool,true或者false,預設時預設為true。

意義:表示是否在執行演算法時,將原始訓練資料複製乙份。若為true,則執行pca演算法後,原始訓練資料的值不會有任何改變,因為是在原始資料的副本上進行運算;若為false,則執行pca演算法後,原始訓練資料的值會改,因為是在原始資料上進行降維計算。

whiten:

型別:bool,預設時預設為false

意義:白化。

components_:返回具有最大方差的成分。

explained_variance_ratio_:返回 所保留的n個成分各自的方差百分比。

n_components_:返回所保留的成分個數n。

mean_

noise_variance_

fit(x,y=none)

fit()可以說是scikit-learn中通用的方法,每個需要訓練的演算法都會有fit()方法,它其實就是演算法中的「訓練」這一步驟。因為pca是無監督學習演算法,此處y自然等於none。

fit(x),表示用資料x來訓練pca模型。

函式返回值:呼叫fit方法的物件本身。比如pca.fit(x),表示用x對pca這個物件進行訓練。

fit_transform(x)

用x來訓練pca模型,同時返回降維後的資料。

newx=pca.fit_transform(x),newx就是降維後的資料。

inverse_transform()

將降維後的資料轉換成原始資料,x=pca.inverse_transform(newx)

transform(x)

將資料x轉換成降維後的資料。當模型訓練好後,對於新輸入的資料,都可以用transform方法來降維。

此外,還有get_covariance()、get_precision()、get_params(deep=true)、score(x, y=none)等方法,以後用到再補充吧。

rsync引數詳解

選項說明 v,verbose 詳細模式輸出 q,quiet 精簡輸出模式 c,checksum 開啟校驗開關,強制對檔案傳輸進行校驗 a,archive 歸檔模式,表示以遞迴方式傳輸檔案,並保持所有檔案屬性,等於 rlptgod r,recursive 對子目錄以遞迴模式處理 r,relative ...

gcc 引數詳解

gcc引數詳解 介紹 gcc and g 分別是gnu的c c 編譯器 gcc g 在執行編譯工作的時候,總共需要4步 1.預處理,生成.i的檔案 預處理器 cpp 2.將預處理後的檔案不轉換成組合語言,生成檔案.s 編譯器 egcs 3.有彙編變為目標 機器 生成.o的檔案 彙編器 as 4.連線...

showModalDialog引數詳解

showmodaldialog ie 4 支援 showmodelessdialog ie 5 支援 window.showmodaldialog 方法用來建立乙個顯示html內容的模態對話方塊。window.showmodelessdialog 方法用來建立乙個顯示html內容的非模態對話方塊。使...