這一周主要是圍繞兩個主題來展開,乙個是機器學習的基本概念和knn演算法的基本邏輯。我們先來談談機器學習方面。
機器學習的概念與用途及分類。
1.概念,主要區分兩個對比,主要參考兩個圖,但是這個兩個概念之間沒有明顯的界限,有時候會互相影響。
à機器學習v.s.人工智慧v.s. 深度學習
à機器學習v.s. 資料探勘v.s.大資料
2. 機器學習的用途,分為三個方面。
à優化評價指標
à發現規律
à用於**
3. 分類
à監督式學習(分類,回歸)
à非監督式學習(聚類)
其實這兩者的區別在於重要的兩點,其一是是否有明顯的標籤用於測試的資料中,其二是否涉及乙個分類。
打乙個栗子,監督試學習:人臉識別,車牌號識別,語音識別等等;而非監督試學習:資料分析,影象處理等等。
knn演算法的介紹
1. 核心思想
à在一定範圍內,找出目標最符合的類別然後進行劃分,這個判斷方法可以是算兩點之間的距離,也可以是在一定k的維度內進行投票,最後劃分到投票多的範圍內。
2. knn演算法需要注意的點
à物體的特徵需要用向量表示否則計算機語言無法識別(此過程叫做feature engineering,特徵工程)
à需要有乙個具體的標籤進行分類
à確定方法去算出相似度(e.g.兩點之間的距離)
à選擇合適的k
3. 重要的概念
à決策邊界涉及到如何尋找合適的k,
à這個過程也叫做調參(cross validation),但是在knn當中引數不屬於模型引數,是在模型外乙個人工設定的開關。
à有時為了減少資料的誤差,會使用特徵縮放將資料與資料之間的差異範圍縮小,主要是是min-max-normalization以及z-score normalization
總結:python的庫的應用太廣泛了,有些時候可能還是需要熟能生巧
機器學習 opencv 人臉識別
鑑於本人的工作環境主要是採用python作為開發工具,故本篇部落格是基於python來做的學習記錄。1.讀取,將其轉換為陣列 from matplotlib import pyplot as pyl import cv2 import numpy img cv2.imread cat.jpg img...
機器學習 人臉識別補全
學習自b站python人工智慧教程 機器學習 精華版 這裡使用的是sklearn中自帶的資料集,值得注意的是部分可能會由於https協議證書的問題造成資料引入失敗,這裡要加入 可以完美解決。本章的主要目的是比較不同演算法的擬合效果。全體,總效果,全套服裝,全套家具,合奏組 對於資料的 會更加精準 資...
機器學習實戰 knn 手寫識別
這個是 機器學習實戰 的第二個例項,用knn演算法實現手寫識別,識別0 9這幾個數字 要實現手寫識別功能,首先將影象資料轉換為矩陣或者向量形式,本例使用32 32的二值影象,轉化成1 1024的陣列,具體 如下 def img2vector filename returnvect zeros 1,1...