機器學習初篇 sklearn手寫數字識別

2021-09-27 04:11:58 字數 1034 閱讀 2397

from sklearn.datasets import load_digits

import matplotlib.pyplot as plt

from sklearn.preprocessing import standardscaler

from sklearn.svm import linearsvc

digits=load_digits()

x_train=digits.data[:1348]#訓練

y_train=digits.target[:1348]#訓練對應的數字

x_test=digits.data[1348:]#測試,不包含起始

y_test=digits.target[1348:]#測試對應的數字

ss=standardscaler()#標準化資料

x_train=ss.fit_transform(x_train)

x_test=ss.transform(x_test)

lsvc=linearsvc()

lsvc.fit(x_train,y_train)#訓練

y_predict=lsvc.predict(x_test)#**

while 1:

test=int(input("輸入**第幾張;"))

test_1=test+1348

print("對{}進行訓練,**第{},**數字為{}".format(len(x_train),test,y_predict[test]))

if y_predict[test]==y_test[test]:

print("**正確")

else:

print('錯誤')

sklearn機器學習 PCA

pca使用的資訊量衡量指標,就是樣本方差,又稱可解釋性方差,方差越大,特徵所帶的資訊量越多 原理推導 class sklearn decomposition.pca n components none,copy true whiten false svd solver auto tol 0.0,it...

sklearn 機器學習庫

pipeline parameters steps 步驟 列表 list 被連線的 名稱,變換 元組 實現擬合 變換 的列表,按照它們被連線的順序,最後乙個物件是估計器 estimator memory 記憶體引數,instance of sklearn.external.joblib.memory...

機器學習 Sklearn 除錯模型

1 過擬合 處理過擬合的方法有 a 減少特徵,降低模型的複雜度 b 減小除錯引數 c 增加訓練資料量 常用的調參方法就是通過在懲罰函式中新增乙個正則化引數c來控制分類邊界對樣本的辨識度,如果是用權重的二次方,則是l2正則化,如果是 w c則是l1正則化。l2損失函式 x是訓練集,w權重矩陣,b是偏置...