數學知識歐式距離:
使用k近鄰演算法的條件:
1. 你需要乙個訓練的資料集,這個資料集包含各種特徵值和對應的label值 ,在使用前需要將各種特徵值
歸一化處理。
2. 利用訓練的資料集來對要分類的資料進行分類:
根據歐式距離計算出要**的資料與訓練資料集中距離最短的前k個值,然後根據前k個值對應的label
統計出 label值最最多的,如選擇的前k個對應的label:['dog','dog','dog','fish'] ,那麼這個結果是dog類。
k近鄰演算法特點:
優點: 計算精度高,不受異常值影響。
缺點: 計算複雜度高,空間複雜度高
適用於: 帶lable的數值類
python中主要使用函式:
主要的使用numpy 模組,這個模組主要有兩種資料型別:
1. array 型別
2. matrix 型別
mat: 將array 轉化成 matrix
matix.min(0) 獲取特徵值最小值
matix.max(0) 獲取特徵值最大值
參考**:
K近鄰演算法理解及實現(python)
knn的工作原理 給定乙個已知標籤類別的訓練資料集,輸入沒有標籤的新資料後,在訓練資料集中找到與新資料最鄰 近的k個例項,如果這k個例項的多數屬於某個類別,那麼新資料就屬於這個類別。可以簡單理解為 由那些離x最 近的k個點來投票決定x歸為哪一類。在二維平面下 在n維空間下,也就是n個特徵值來決定新輸...
mongodb 使用場景和不使用場景
1.mongodb介紹 mongodb 名稱來自 humongous 是乙個可擴充套件的高效能,開源,模式自由,面向文件的資料庫。它使用c 編寫。mongodb特點 a.面向集合的儲存 適合儲存物件及json形式的資料。b.動態查詢 mongo支援豐富的查詢表達方式,查詢指令使用json形式的標記,...
mongodb 使用場景和不使用場景
mongodb 使用場景和不使用場景 2012 09 26 10 30 18 分類 linux 1.mongodb介紹 mongodb 名稱來自 humongous 是乙個可擴充套件的高效能,開源,模式自由,面向文件的資料庫。它使用c 編寫。mongodb特點 a.面向集合的儲存 適合儲存物件及js...