Python監督學習 K近鄰分類

2021-10-02 06:15:59 字數 2609 閱讀 1777

首先匯入資料集forge(),畫出鄰居為1的情況的圖,橫縱軸均為特徵值

畫出鄰居為3的情況

匯入資料分好資料集與測試集-->例項化-->分類器進行擬合-->**-->評估

from sklearn.model_selection import train_test_split

x, y = mglearn.datasets.make_forge()

x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)

from sklearn.neighbors import kneighborsclassifier

clf = kneighborsclassifier(n_neighbors=2)

clf.fit(x_train, y_train)

print("test set prediction: {}".format(clf.predict(x_test)))

print("test set accuracy: ".format(clf.score(x_test, y_test)))

決策邊界視覺化

用cancer資料集討論模型複雜度與泛化能力之間的關係

x_train, x_test, y_train, y_test = train_test_split(

cancer.data, cancer.target, stratify=cancer.target, random_state=66)

training_accuracy =

test_accuracy =

neighbors_settings = range(1, 11)

for n_neighbors in neighbors_settings:

'''構建模型'''

clf = kneighborsclassifier(n_neighbors=n_neighbors)

clf.fit(x_train, y_train)

# 記錄訓練集精度

# 記錄泛化精度

機器學習筆記 監督學習 無監督學習分類筆記

無監督學習 給出一資料組,並已知曉這組資料的對應關係,然後給出一組新的資料,嘗試對其進行 和分析,這裡注意,提前給出的資料組 data set 是已知內部的資料的對應關係,後面給出的新的資料,是要依據對之前資料的學習後,給出新的資料對應的 值。而對於 的結果的不同,又將監督學習分為分類 classf...

監督學習和無監督學習 監督學習與非監督學習

監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...

監督學習 線性分類器

python 1 分割資料 部分資料用於做模型訓練 一般需要的資料量比較大,可以通過網上公開的資料來源,或者向企業獲取,或者自己爬蟲?一部分資料用於測試模型的準確度 用到sklearn.cross valiation裡的train test split函式 x train,x test,y trai...