SciKit learn快速入門教程和例項(二)

2021-08-14 20:30:37 字數 2748 閱讀 2799

知乎專欄:

繼續上次對波士頓房價**的討論,了解模型的屬性和功能。

#首先導入庫,使用的是線性回歸

from sklearn import datasets

from sklearn.linear_model import linearregression

#匯入波士頓房價資料集

loaded_data = datasets.load_boston()

#data_x是訓練資料

data_x = loaded_data.data

#data_y是匯入的標籤資料

data_y = loaded_data.target

#建立模型,線性回歸模型

model = linearregression()

#進行資料擬合,通過訓練得到模型引數

model.fit(data_x,data_y)

#使用訓練過的模型對資料進行**,**是前四行的資料

print(mode.predict(data_x[:4,:]))

#輸出模型的兩個引數,在這裡分別指的是,線性回歸模型的斜率和截距

print(model.coef_)

print(model.intercept_)

#取出之前定義的模型的引數

print(model.get_params())

#使用均方誤差對其進行打分,輸出精確度,

#即利用訓練好的模型對data_x進行**,得到**後,和原本標籤進行比較

print(model.score(data_x,data_y))

輸出結果

資料的尺度會有所不同,這會影響機器學習的速度,可以使用正規化,將資料變成範圍大致相同的區域。首先說下何為資料標準化。

#載入標準化資料的模組

from sklearn import prepocessing

import numpy as np

#建立乙個陣列,可以看大資料大小比較大

a = np.array([

[10,2.7,3.6],

[-100,5,-2],

[120,20,40],dtype=np.float64

])#輸出標準化後的結果

print(prepossing.scale(a))

結果是:

[[ 0.         -0.85170713 -0.55138018]

[-1.22474487 -0.55187146 -0.852133 ]

[ 1.22474487 1.40357859 1.40351318]]

經過標準化後,資料範圍變得大致相同,可以提高我們訓練的速度。

#載入模組

from sklearn import prepocessing

import numpy as np

#載入模組,對資料進行分類

from sklearn.model_ selection import train_test_split

#載入模組,用於產生易分類的資料

from sklearn.datasets.smples_generator import make_classification

#匯入svm模組

from sklearn.svm imoprt svc

#匯入畫圖模組

import matplotlib.pyplot as plt

#產生乙個分類資料集

x, y = make_classification(

n_samples=300, n_features=2,

n_redu***ant=0, n_informative=2,

random_state=22, n_clusters_per_class=1

scale=100

)#將產生的資料,在圖中畫出來

#建立乙個模組

clf = svc()

#訓練資料

clf.fit(x_train,y_train)

#利用訓練好的模型,比對資料

print(clf.score(x_test, y_test))

#首先對資料進行標準化,其他和上面一樣

x = preprocessing.scale(x)

x_train, x_test, y_train, y_test = train_test_split(x,y,test_size=0.3)

clf = svc()

clf.fit(x_train,y_train)

print(clf.score(x_test,y_test)

以上眾多內容,參照莫煩教程更詳細的內容可以去他官網檢視。

Scikit learn快速入門

基礎入門的知識,我就不重複造輪子了。直接上 想看 詳細解釋的,看上面的部落格。匯入模組 from future import print function 匯入sklearn中的資料集 from sklearn import datasets 匯入測試集 from sklearn.cross val...

SciKit learn快速入門教程和例項(二)

知乎專欄 繼續上次對波士頓房價 的討論,了解模型的屬性和功能。首先導入庫,使用的是線性回歸 from sklearn import datasets from sklearn.linear model import linearregression 匯入波士頓房價資料集 loaded data da...

scikit learn分類問題入門例項(1)

本文以scikit learn自身的digits資料集為例,闡釋分類問題 首先利用pca進行降維 然後訓練模型 from sklearn.cross validation import train test split from sklearn.bayes import gaussiannb ran...