"""
1.獲取資料集
2.資料基本處理
3.特徵工程
4.機器學習(模型訓練)
5.模型評估
"""from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import standardscaler
from sklearn.neighbors import kneighborsclassifier
# 1.獲取資料集
iris = load_iris(
)# 2.資料基本處理
# 2.1 資料分割
""" random-state的取值是0-2^32,當random-state=1時,他按一定的規則去取出我們的資料,當random-state=2時,他又按另一種規則來取我們資料。random-state不變,則每次執行程式測試集和訓練集都是同樣的資料
"""x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=
22,test_size=
0.2)
# 3.特徵工程
# 3.1 例項化乙個轉換器
transfer = standardscaler(
)# 3.2 呼叫fit_transform方法
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)
# 4.機器學習(模型訓練)
# 4.1 例項化乙個估計器
estimator = kneighborsclassifier(n_neighbors=5)
# 意思是k=5,依靠離這點最近的五個點來選擇屬於哪個類
# 4.2 模型訓練
estimator.fit(x_train,y_train)
# 5.模型評估
# 5.1 輸出**值
y_pre = estimator.predict(x_test)
print
("**值是:\n"
,y_pre)
print
("**值和真實值對比:\n"
,y_pre==y_test)
# 5.2 輸出準確率
ret = estimator.score(x_test,y_test)
print
("準確率是:\n"
,ret)
knn演算法 鳶尾花
knn分類演算法實現鳶尾花 對鳶尾花利用knn演算法進行分類,利用python的sklean庫極大方便了python的使用,減少了大量 的書寫。knn演算法的 是通過計算歐氏距離來確定 鳶尾花的結果,遍歷所有樣本集,計算待分類樣本與每個樣本的距離,計算並儲存後排序,尋找k個近鄰,最後輸出最小結果即為...
knn實現鳶尾花分類
依照歐氏距離計算公式計算測試資料與訓練集的距離 按照距離公升序排序,選取距離最小的k個點 確定前k個點所在類別的出現頻率 返回前k個點出現頻率最高的類作為測試資料的 分類 import operator import numpy as np from sklearn.datasets import ...
KNN實現鳶尾花分類
將其按照7 3的比例劃分為訓練集和測試集。前4列為特徵,第5列為類別,setosa 視為1,versicolor 視為2,virginica 視為3 測試集順序略有調整。最簡單最初級的分類器是將全部的訓練資料所對應的類別都記錄下來,當測試物件的屬性和某個訓練物件的屬性完全匹配時,便可以對其進行分類。...