knn一種分類演算法,有監督學習,注意與k-means的不同,k-means為無監督學習。
從knn名字,k個最近的鄰居:k取值能夠決定這個中心元素屬於哪個類別。
假設,**x為哪個類別,選取乙個k值,則x附近k個元素為什麼類別,那麼,x就為此類別。
假設,k為3:
從圖中能夠看出,綠色方塊屬於三角形類別,因為在方塊最近的範圍內的三個元素,三角形權重最大。
即:
假設k為5:
從圖中看出,三角形為2個,圓為三個,圓佔的權重大,因此,方塊的類別應該屬於圓。
簡單結論:不同的k選取,待分類的元素被分類的結果也會不一樣。
從上得出,需要解決的問題有k的選取,距離的計算。
演算法大概過程:
1.計算每個資料到待**資料的歐式距離(也可以是其他距離)
2.對距離進行公升序排序
3.選取前k個
4.加權平均(距離中心資料越近的權值相對應該更大)
注意的地方:k太大,分類模糊
k太小,受個例影響
KNN K最近鄰分類模型
knn原理 訓練元組用 n個屬性描述,每個元組代表 n維空間中的乙個點,所有的訓練元組存放在 n維的模式空間。當給定乙個未知元組時,搜尋該模式空間,找出最接近未知元組的 k個訓練元組。未知元組指派到它的 k個最近鄰中的多數類。鄰近性 用距離度量,如歐幾里德距離。knn演算法中的細節處理 數值屬性規範...
KNN K最近鄰演算法 例項應用
knn演算法是尋找最近的k個資料,推測新資料的分類 通用步驟 計算距離 常用有歐幾里得距離 馬氏距離 公升序排序 取前k個 加權平均 k的選取 資料分析與預處理 m 惡性 b 良性 其他資料為判斷良性 惡性的依據 劃分資料集 取資料的1 3作為測試集,2 3作為訓練集 import random i...
最近鄰居法KNN
在模式識別領域中,最近鄰居法 knn演算法,又譯k 近鄰演算法 是一種用於分類和回歸的非引數統計方法。1 在這兩種情況下,輸入包含特徵空間中的k個最接近的訓練樣本。最近鄰居法採用向量空間模型來分類,概念為相同類別的案例,彼此的相似度高,而可以藉由計算與已知類別案例之相似度,來評估未知類別案例可能的分...