關於樸素貝葉斯中multinomialnb,gaussiannb,bernoulinb的解釋,見:### multinomial ***** bayes classifier
from sklearn.*****_bayes import multinomialnb
clf = multinomialnb(alpha=0.01)
clf.fit(train_x, train_y)
### knn classifier
from sklearn.neighbors import kneighborsclassifier
clf = kneighborsclassifier()
clf.fit(train_x, train_y)
### logistic regression classifier
from sklearn.linear_model import logisticregression
clf = logisticregression(penalty='l2')
clf.fit(train_x, train_y)
### random forest classifier
from sklearn.ensemble import randomforestclassifier
clf = randomforestclassifier(n_estimators=8)
clf.fit(train_x, train_y)
### decision tree classifier
from sklearn import tree
clf = tree.decisiontreeclassifier()
clf.fit(train_x, train_y)
### gbdt(gradient boosting decision tree) classifier
from sklearn.ensemble import gradientboostingclassifier
clf = gradientboostingclassifier(n_estimators=200)
clf.fit(train_x, train_y)
### svm classifier
from sklearn.svm import svc
clf = svc(kernel='rbf', probability=true)
clf.fit(train_x, train_y)
關於隨機森林中引數的解釋,見:
關於核函式的解釋,見:
常用的核函式有:線性核函式,多項式核函式,徑向基核函式,sigmoid核函式和復合核函式,傅利葉級數核,b樣條核函式和張量積核函式等核函式/4693132?fr=aladdin
kernel: str引數 預設為『rbf』, 演算法中採用的核函式型別,可選引數有:『linear』:線性核函式, 『poly』:多項式核函式 , 『rbf』:徑像核函式/高斯核, 『sigmod』: sigmod核函式, 『precomputed』:核矩陣
sklearn 分類轉換為分類數值
標籤專用,能夠將分類轉換為分類數值 特徵專用,能夠將分類特徵轉換為分類數值 將原本的 原本為male與female,現在將這兩個資料轉換為0和1 原本的embarked,不同的艙位,有scq三種,現在可以轉換為0 1 2 servived有yes no unknown,轉換為0 1 2 import...
用sklearn中的SVM畫資料的分類面
參考部落格 所用資料如下 如下,有詳細注釋 from sklearn import svm import numpy as np import matplotlib.pyplot as plt dataset np.array 1,2,1 2,3,1 3,3,1 2,1,1 3,2,1 x trai...
sklearn分類演算法例項(SVC KNN
2.2 劃分資料集 2.3 選取模型進行定價分類 總結資料集展示 可見,car資料集有6個屬性 buying maint doors persons lug boot safety 其取值範圍如下 其類別class的取值範圍如下 因為資料中很多為非數值型取值,因此需要將其數位化。資料中全為非空取值,...