首先,我們建立名為knn.py的python模組。
from numpy import *
import operator
defcreatedataset
(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
labels=['a','a','b','b']
return group,labels
我們直接引用這個模組是會報錯的。
in [15]: import knn
traceback (most recent call
last):
file "", line 1, in
import knn
importerror: no
module named knn
要在python shell中呼叫這個函式,進入python互動開發環境
我們先使用os模組,
**檢視當前路徑 os.getcwd()
更改當前路徑 os.chdir()**
in [17]: import os
in [19]: os.getcwd()
out[19]: 'c:\\users\\administrator'
我們將knn.py模組存放在 『c:\users\administrator』 的路徑下面。
in [20]: import knn
in [22]: group,labels=knn.createdataset()
in [23]: group
out[23]:
array([[ 1. , 1.1],
[ 1. , 1. ],
[ 0. , 0. ],
[ 0. , 0.1]])
in [24]: labels
out[24]: ['a', 'a', 'b', 'b']
這樣我們發現可以進入knn模組,並且驗證了定義的函式。 機器學習實戰 kNN
一 演算法過程 1 首先存在乙個資料集作為訓練樣本集dataset,比如訓練樣本的資料中,每一條資料都包含乙個城市的某一天空氣中的pm2.5,no2濃度等維度的特徵值。每一條資料同時包含乙個標籤,比如這一天的空氣質素是優,良,輕度汙染,中度汙染,重度汙染中的乙個。2 現在我們輸入一條資料inx,如包...
機器學習實戰 KNN
import numpy as np import operator def createdataset group np.array 1.0,1.1 1.0,1.0 0,0 0,0.1 labels a a b b return group,labels def classify0 inx,dat...
機器學習實戰 kNN
k 近鄰演算法 knn k nearest neighbors 測量不同特徵值之間的距離方法進行分類。有乙個樣本資料集 每個樣本都存在標籤 輸入沒有標籤的新資料後,將新資料的每個特徵與樣本集中資料對應的特徵進行比較,提取樣本集中特徵最相似資料 最近鄰 的分類標籤。一般,只選擇樣本資料中前k個最相似的...