實現卷積神經網路
1.訓練集不僅包含神經網路需要**的物件分類標籤,還包含表示邊界框(bounding box)的四個數字(邊界框的中心點,框長和框寬)
example:
1.pedestrian 2.car 3.motorcycle 4.background
need to output:(bx,by),bh,bw,class label(1-4)
視窗滑動目標檢測
以某個步幅在影象中滑動視窗,遍歷整張,判斷目標是否在視窗中。每乙個視窗利用卷積網路進行處理。計算成本較高,速度慢
通過卷積實現滑動視窗物件檢測
輸出精準的邊界框——yolo
主題思想:將影象進行網格劃分,將檢測物件的中點分配到其中點所在的格仔,即使物件可以橫跨多個格仔,也只會被分配到其中的乙個格仔當中。
執行速度快,通過單次卷積處理影象。
交並比(lou)函式
計算兩個邊界框交集部分和並集部分之比。
一般約定,計算機視覺中,如果lou大於或等於0.5,說明檢測正確。0.5閾值來判斷**的邊界框是否正確。衡量定位精確度的一種方式。
非極大值抑制
清除重複的檢測物件,對目標物件只檢測一次。只輸出檢測概率最大的分類結果,利用概率最大的結果來抑制其他檢測概率較小的檢測結果。
1.設定某個閾值大小,當檢測結果是目標物的概率小於該閾值時,則抑制輸出;如果大於該閾值,則輸出檢測結果。
2.經過第一步篩選後,還存在與檢測概率最大的輸出邊界框面積重合較高的邊界框時,設定交並比的閾值大小,清除這些佔比較高的邊界框,只留下最終的輸出結果。
機器學習筆記22 神經網路 卷積神經網路
參考資料 面向機器智慧型的tensorflow實踐 keras example mnist cnn.py keras中文文件 常用層卷積層 卷積理解就是之前影象處理裡用作檢測邊緣 檢測角點的運算元,例如 輸入 12 34 begin 1 2 3 4 end 13 24 核 2 begin 2 end...
卷積神經網路筆記
一 卷積神經網路基礎 cnn是一種空間上共享引數的神經網路,它通過正向和反向傳播,自己學習識別物體。它可能有幾層網路構成,第一層是抽象層次的最底層,cnn一般把中的較小的部分識別成簡單的形狀,下一層將會上公升到更高的抽象層次,一般會識別更複雜的概念,以此類推,直至識別整個物體。cnn的學習方式 層次...
卷積神經網路筆記
卷積神經網路依舊是乙個可導的評分函式,該函式輸入為原始影象畫素,輸出是不同類別的評分。並假設輸入資料是影象,基於該假設,向結構中新增一些特有性質。常規神經網路的輸入是乙個向量,對大尺寸影象效果不好,效率低下,大量引數導致網路過擬合。神經元的各層三維排列 寬度,高度和深度 深度是指啟用函式資料體的第3...