可參考:
想一下之前做的特徵工程的步驟?
1 例項化 (例項化的是乙個轉換器類(transformer))
2 呼叫fit_transform(對於文件建立分類詞頻矩陣,不能同時呼叫)
我們把特徵工程的介面稱之為轉換器,其中轉換器呼叫有這麼幾種形式
fit_transform
fit 得到資料的均值、標準差
transform 根據fit步驟得到的轉換引數,去轉換特徵
在sklearn中,估計器(estimator)是乙個重要的角色,是一類實現了演算法的api
1 用於分類的估計器:
sklearn.neighbors k-近鄰演算法
sklearn.*****_bayes 貝葉斯
sklearn.linear_model.logisticregression 邏輯回歸
sklearn.tree 決策樹與隨機森林
2 用於回歸的估計器:
sklearn.linear_model.linearregression 線性回歸
sklearn.linear_model.ridge 嶺回歸
3 用於無監督學習的估計器
sklearn.cluster.kmeans 聚類
PySpark入門十八 ML之評估器
評估器被視為需要評估的統計模型,對資料做 或分類。包含了七種分類。logisticregresssion 邏輯斯蒂回歸,實際作用於二分類場景 decisiontreeclassifier 決策樹,適用於分類場景。maxdepth 限制樹的深度,mininstancepernode 樹節點觀察資料的最...
驗證器 轉換器
同一namespace下的tag不能定義到多個檔案中,不支援模組化 formcoderangevalidator2 formcoderangevalidatorid2 seam允許將seam元件作為jsf converter,validator使用,參見滿江紅文件。這樣不需要在faces confi...
機器學習 轉換器與估計器
轉換器 1 例項化 例項化的是乙個轉換器類 transformer 2 呼叫fit transform 對於文件建立分類詞頻矩陣,不能同時呼叫 估計器 機器學習演算法的實現 在sklearn中,估計器 estimator 是乙個重要的角色,分類器和回歸器都屬於estimator,是一類實現了演算法的...