機器學習筆記 5 sklearn基本使用

2021-08-10 04:11:10 字數 1093 閱讀 7703

先上**

# -*- coding: utf-8 -*-

from __future__ import division

import pandas as pd

from sklearn.ensemble import randomforestclassifier

from sklearn.cross_validation import train_test_split

from sklearn.multiclass import onevsrestclassifier

from sklearn.svm import svc

df = pd.read_csv('iris.csv')

# 分類器物件

clf = onevsrestclassifier(svc(kernel='linear')) # 支援向量機

##clf = randomforestclassifier(max_depth=5, n_estimators=10)

x = df.ix[:,1:5]

y = df.ix[:,5]

# 訓練集和測試集分類器

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=.3)

clf.fit(x_train,y_train)

# 用訓練得到的分類器對測試集進行**

y_pred = clf.predict(x_test)

# 用pandas建立乙個**

rf = pd.dataframe(list(zip(y_pred, y_test)), columns=['predicted','actual'])

if r['predicted'] == r['actual'] else

0, axis=1)

print rf

print rf['correct'].sum()/rf['correct'].count()

結果如下

機器學習sklearn實戰筆記 一

寫在開始的話 什麼是sklearn?tensorflow又是什麼?sklearn是python的乙個非常流行的機器學習庫.tensorflow是google研發的非常流行的深度學習庫.簡單講,深度學習是機器學習的乙個分類,這裡不再贅述.通過本系列文章你將懂得 了解監督學習,非監督學習,資料處理等在s...

sklearn機器學習 PCA

pca使用的資訊量衡量指標,就是樣本方差,又稱可解釋性方差,方差越大,特徵所帶的資訊量越多 原理推導 class sklearn decomposition.pca n components none,copy true whiten false svd solver auto tol 0.0,it...

sklearn 機器學習庫

pipeline parameters steps 步驟 列表 list 被連線的 名稱,變換 元組 實現擬合 變換 的列表,按照它們被連線的順序,最後乙個物件是估計器 estimator memory 記憶體引數,instance of sklearn.external.joblib.memory...