sklearn中的分類方法

2021-09-12 14:28:34 字數 1560 閱讀 3712

### multinomial ***** bayes classifier    

from sklearn.*****_bayes import multinomialnb

clf = multinomialnb(alpha=0.01)

clf.fit(train_x, train_y)

### knn classifier

from sklearn.neighbors import kneighborsclassifier

clf = kneighborsclassifier()

clf.fit(train_x, train_y)

### logistic regression classifier

from sklearn.linear_model import logisticregression

clf = logisticregression(penalty='l2')

clf.fit(train_x, train_y)

### random forest classifier

from sklearn.ensemble import randomforestclassifier

clf = randomforestclassifier(n_estimators=8)

clf.fit(train_x, train_y)

### decision tree classifier

from sklearn import tree

clf = tree.decisiontreeclassifier()

clf.fit(train_x, train_y)

### gbdt(gradient boosting decision tree) classifier

from sklearn.ensemble import gradientboostingclassifier

clf = gradientboostingclassifier(n_estimators=200)

clf.fit(train_x, train_y)

### svm classifier

from sklearn.svm import svc

clf = svc(kernel='rbf', probability=true)

clf.fit(train_x, train_y)

關於樸素貝葉斯中multinomialnb,gaussiannb,bernoulinb的解釋,見:

關於隨機森林中引數的解釋,見:

關於核函式的解釋,見:

常用的核函式有:線性核函式,多項式核函式,徑向基核函式,sigmoid核函式和復合核函式,傅利葉級數核,b樣條核函式和張量積核函式等核函式/4693132?fr=aladdin

kernel: str引數 預設為『rbf』, 演算法中採用的核函式型別,可選引數有:『linear』:線性核函式, 『poly』:多項式核函式 , 『rbf』:徑像核函式/高斯核, 『sigmod』: sigmod核函式, 『precomputed』:核矩陣

sklearn 分類轉換為分類數值

標籤專用,能夠將分類轉換為分類數值 特徵專用,能夠將分類特徵轉換為分類數值 將原本的 原本為male與female,現在將這兩個資料轉換為0和1 原本的embarked,不同的艙位,有scq三種,現在可以轉換為0 1 2 servived有yes no unknown,轉換為0 1 2 import...

用sklearn中的SVM畫資料的分類面

參考部落格 所用資料如下 如下,有詳細注釋 from sklearn import svm import numpy as np import matplotlib.pyplot as plt dataset np.array 1,2,1 2,3,1 3,3,1 2,1,1 3,2,1 x trai...

sklearn分類演算法例項(SVC KNN

2.2 劃分資料集 2.3 選取模型進行定價分類 總結資料集展示 可見,car資料集有6個屬性 buying maint doors persons lug boot safety 其取值範圍如下 其類別class的取值範圍如下 因為資料中很多為非數值型取值,因此需要將其數位化。資料中全為非空取值,...