task2 練死勁兒 先驗框

2021-10-12 10:25:09 字數 514 閱讀 1240

眾所周知,目標檢測最終得到的結果是乙個乙個框,不是直接乙個分類概率那麼簡單,不僅需要知道框住的物體的類別,也要輸出框住物體的位置。那麼如果剛接觸目標檢測的人來說,最正常的想法就是將拆分成很多個窗格,每個窗格去判斷裡面存不存在物體,存在就直接輸出。

更進一步的想法就是,不是窗格輸出之後就結束了,還要去調整窗格的位置,可以建立窗格的回歸引數網路。

但是很顯然,乙個乙個遍歷的方式是在是太繁瑣,時代進步都是快字最重要,那麼怎麼生成這樣的窗格呢。下面該介紹卷積的作用了。卷積核的作用其實就是將乙個區域的所有畫素線性對映成乙個特徵,卷積的作用就是將大的對映成乙個feature map,這裡的對映其實就是神經網路。可以說feature可以包含這個的資訊,大家都知道卷積核在卷積的過程中是乙個乙個重疊的,不是乙個乙個併排站的,也就是說卷積的區域是有重疊的,那麼feature乙個特徵點和它周圍的一些特徵點(規則區域特徵點)就可以表示原圖上的乙個區域的所有特徵了,也就是說是現成的特徵,以乙個乙個特徵點去劃分,特徵就都是現成的了。就可以做到乙個feature map所有的anchors都出的效果。

DatawhalTask02 練死勁兒 網路設計

先驗框和錨框是同乙個概念 為了減少先驗框的數量,先利用vgg16對影象進行下取樣 先驗框的生成 def create prior boxes create the 441 prior default boxes for the network,as described in the tutorial...

深度學習Task2

讀入文字 分詞建立字典,將每個詞對映到乙個唯一的索引 index 將文字從詞的序列轉換為索引的序列,方便輸入模型 課後練習 語言模型 假設序列w1 w2 wt中的每個詞是依次生成的,我們有 語言模型的引數就是詞的概率以及給定前幾個詞情況下的條件概率。設訓練資料集為乙個大型文字語料庫,如維基百科的所有...

NLP 理論實踐 Task2

正向最大匹配法演算法流程 從前往後取詞,每次減乙個字,直至詞典命中或剩下1個單字。假設詞典中最長的單詞為 5 個,那麼最大匹配的起始子串字數也為 5 個 1 從左往右讀入子串,掃瞄字典,測試讀入的子串是否在字典中 2 如果存在,則從輸入中刪除掉該子串,重新按照規則取子串,重複 1 3 如果不存在於字...