sklearn工具 學習筆記1

2021-10-08 15:13:24 字數 1504 閱讀 9446

sklearn包:

監督學習:sklearn.

neighbors:近鄰

svm:支援向量機

kernel-ridge:核嶺回歸

discriminant_analysis:判別分析

linear_model:廣義線性模型

ensemble:整合方法

tree :決策樹

naïve_bayes:樸素貝葉斯

cross_decomposition:交叉分解

gaussian_process:高斯過程

neural_network:多層神經網路

calibration:概率校準

isotomic:保序回歸

feature_selection:監督特徵選擇

multiclass:多類多標籤演算法

無監督學習:sklearn.

decomposition:矩陣因子分解

cluster:聚類分析

manifold:流形學習

mixture:高斯混合模型

neural_network:無監督多層神經網路

density:密度估計

covariance:協方差估計

頂層繼承類:sklearn.base.

baseestimator:所有評估器的父類

classifiermixin:所有分類器的父類,其子類必須實現乙個score函式

regressormixin:所有回歸器的父類,其子類必須實現乙個score函式

clustermixin:所有聚類的父類,其子類必須實現乙個fit_predict函式

biclustermixin:

transformermixin:所有資料變換的父類,其子類必須實現乙個fit_transform函式

densitymixin:所有密度估計相關的父類,其子類必須實現乙個score函式

metaestimatormixin:

sklearn 六大板塊統一api介面:

六大板塊:

分類(classification)\回歸(regression)\聚類(clustering)

維數約簡(dimensionality)\特徵抽取選擇(feature extraction\selection)

\資料預處理(preprocessing)

統一api:

1、 資料載入和預處理

2、訓練集訓練:estimator.fit(x_train,y_train)

3、用訓練好的模型在測試集**:

estimator.predict(x_test):classification、regression、clustering

estimator.transform(x_test):preprocessing、dimensionality、feature extraction\selection

5、 對模型進行效能評估:estimator.score(x_test,y_test):classification、regression

sklearn工具 學習筆記4

sklearn資料集變換 dataset transformation 1 pipeline and featureunion 並行或序列組合變換器 1 pipeline 可以用於把多個estimators級聯為乙個estimator,pipeline物件使用 key,value 列表來構建,其中k...

sk learn 學習官方筆記1

scikit learn提供了一些標準資料集,例如 用於分類的 虹膜和數字資料集和波士頓房價回歸資料集。在下文中,我們從shell中啟動乙個python直譯器,然後載入iris和digits資料集。我們的符號約定是 表示shell提示符,而 表示python直譯器提示符 python fromskl...

sklearn學習筆記

1.波士頓房價線性回歸模型 from sklearn import datasets from sklearn.linear model import linearregression boston datasets.load boston data x boston.data y boston.t...