使用python簡單的獲取資料、處理資料、資料**
#!/usr/bin/env python3
# -*- coding:utf-8 -*-
from sklearn.svm.classes import svc
from pil.imageenhance import color
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn import preprocessing
from sklearn.model_selection import validation_curve
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import linearregression
from matplotlib import rcparams
from sklearn.linear_model import logisticregression
# 引入資料集,使用自帶的紅酒資料集
wine = datasets.load_wine(
)# x表示樣本的特徵值
x = wine.data
# y表示樣品的類別
y = wine.target
# 對資料進行標準化預處理
scaler = preprocessing.standardscaler(
).fit(x)
scaler.transform(x)
# 將每個特徵值固定到乙個固定範圍
scaler = preprocessing.minmaxscaler(feature_range=(0
,1))
.fit(x)
scaler.transform(x)
# 利用sklearn提供的train_test_split方法,將資料集劃分為測試集和訓練集
# 測試集和訓練集的比例為3:7
x_train, x_test, y_train, y_test = train_test_split(
x, y, test_size=
0.3, random_state=42)
print
('測試集:'
, y_test)
# 定義線性回歸模型
model1 = linearregression(
).fit(x_train, y_train)
predict1 = model1.predict(x_test)
print
('線性模型**前20個結果為:'
,'\n'
, predict1[:20
])# 定義邏輯回歸模型
model2 = logisticregression(penalty=
'l2'
, dual=
false
, tol=
0.0001
, c=
1.0,
fit_intercept=
true
, intercept_scaling=
1, class_weight=
none
, random_state=
none
, solver=
'liblinear'
, max_iter=
100, multi_class=
'ovr'
, verbose=
0, warm_start=
false
, n_jobs=1)
model2.fit(x_train, y_train)
predict2 = model2.predict(x_test)
print
('邏輯回歸模型**前20個結果為:'
,'\n'
, predict2[:20
])rcparams[
'font.sans-serif']=
'simhei'
fig = plt.figure(figsize=(10
,6))
# 設定空白畫布,並制定大小
# 用不同的顏色表示不同資料
plt.plot(
range
(y_test.shape[0]
), y_test,
color=
"blue"
, linewidth=
1.5, linestyle=
"-")
# 線性回歸模型繪圖
plt.plot(
range
(y_test.shape[0]
), predict1,
color=
"red"
, linewidth=
1.5, linestyle=
"-."
)# 邏輯回歸模型繪圖
plt.plot(
range
(y_test.shape[0]
), predict2,
color=
"yellow"
, linewidth=
1, linestyle=
"-."
)plt.legend(
['真實值'
,'線性回歸模型**值'
,'邏輯回歸模型**值'])
plt.show(
)
學習記錄 sklearn線性回歸
本文旨在記錄colin老師workshop的exercise1講解,包含入門級的sklearn操作 首先導入庫 import numpy as np import pandas as pd import scipy.stas as stats import sklearn 其次匯入資料,這裡使用的是...
sklearn學習目錄(學習記錄)
隨機森林 決策樹神經網路演算法 強化學習 sklearnapi api使用方法 找模型 注意區分是連續還是離散 檢視模型的引數 檢視模型的屬性和方法 模型使用方法 例項化模型 匯入測試資料 fit 得到評分 score 根據評分或交叉驗證結果調整引數 著重介紹決策樹和隨機森林的使用 調參 交叉驗證 ...
sklearn學習 sklearn學習的相關資料
0 scikit learn官網 1 使用sklearn進行整合學習 理論 2 使用sklearn進行整合學習 實踐 3 sklearn學習筆記之開始 4 誰動了我的特徵?sklearn特徵轉換行為全記錄 5 使用sklearn優雅地進行資料探勘 備註 作者是個大神 6 sklearn多個例項 7 ...