先上**
# -*- coding: utf-8 -*-
from __future__ import division
import pandas as pd
from sklearn.ensemble import randomforestclassifier
from sklearn.cross_validation import train_test_split
from sklearn.multiclass import onevsrestclassifier
from sklearn.svm import svc
df = pd.read_csv('iris.csv')
# 分類器物件
clf = onevsrestclassifier(svc(kernel='linear')) # 支援向量機
##clf = randomforestclassifier(max_depth=5, n_estimators=10)
x = df.ix[:,1:5]
y = df.ix[:,5]
# 訓練集和測試集分類器
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=.3)
clf.fit(x_train,y_train)
# 用訓練得到的分類器對測試集進行**
y_pred = clf.predict(x_test)
# 用pandas建立乙個**
rf = pd.dataframe(list(zip(y_pred, y_test)), columns=['predicted','actual'])
if r['predicted'] == r['actual'] else
0, axis=1)
print rf
print rf['correct'].sum()/rf['correct'].count()
結果如下
機器學習sklearn實戰筆記 一
寫在開始的話 什麼是sklearn?tensorflow又是什麼?sklearn是python的乙個非常流行的機器學習庫.tensorflow是google研發的非常流行的深度學習庫.簡單講,深度學習是機器學習的乙個分類,這裡不再贅述.通過本系列文章你將懂得 了解監督學習,非監督學習,資料處理等在s...
sklearn機器學習 PCA
pca使用的資訊量衡量指標,就是樣本方差,又稱可解釋性方差,方差越大,特徵所帶的資訊量越多 原理推導 class sklearn decomposition.pca n components none,copy true whiten false svd solver auto tol 0.0,it...
sklearn 機器學習庫
pipeline parameters steps 步驟 列表 list 被連線的 名稱,變換 元組 實現擬合 變換 的列表,按照它們被連線的順序,最後乙個物件是估計器 estimator memory 記憶體引數,instance of sklearn.external.joblib.memory...