現在主流的方法還是按照深度學習的思路來設計乙個多層的神經網路,所修改的大部分是網路的結構,層數,而在訓練時,我們需要採用所謂資料增強的方式來對資料進行變換,以期能夠應對現實中資料的各種變化,但是我們應該注意到以imagenet為代表的資料集,其中要識別的物體大部分是具有一種相對固定的形狀,或者是由形狀相對固定的模組組合而成的。
對於上述物體的檢測,實際上如果我們如果將該物體精確選中,對其進行各種變換,變換完成後,疊加到乙個雜訊背景上進行訓練, 如下圖所示,將來做識別的時候,根據一些先驗知識如邊緣點或是顏色等進行初步預選,然後用平移候選檢測框去進行檢測,一般情況下可以正確檢測到該物體。
前述的這種變換不需要非常密集的取樣,因為在一般情況下,我們認為一些沒有覆蓋到的情況可以用相鄰的近似情況插值生成,而神經網路本身是通過微分反饋迭代,如果相鄰兩個影象輸入都是同乙個結果,那麼這兩個影象的線性加權影象輸入網路後得到的結果也應該基本是相同的。
但是對於柔性物體,這種方法不是總會管用,因為柔性物體的變化形式不是總能用線性加權的方式來表示的,如下圖所示的蛇(為了避免引起不適,使用了簡筆畫)。
或者極端一點的情況,檢測一根頭髮絲。諸如此類的情況,該如何去設計相應的演算法或是對現在的演算法進行修改呢?
對於人工智慧的思考
這些天來被alphago和李世石的 世紀人機大戰 刷屏,由此引出的對人工智慧好壞的思考成為人們以及 談論的焦點,一說人工智慧將會服務人類,戰勝李世石是計算機史上的里程碑事件,又一說自學習人工智慧將會成為 終結者 裡的天網,最終毀滅人類.而現實則是由一場人機大戰引發的滔滔的 的戰爭.我一直有乙個幻想,...
人工智慧落地的思考
顯然,人工智慧已經為眾人所熟知,人們生活中已充斥著智慧型的字眼。誠然,alphago打敗了世界冠軍,機器同聲傳譯獲得了巨大成功,而事實上,人工智慧還遠遠沒有達到人類想象的境界。我們先不談人工智慧是否可以取代人類,也不談是否會給人類帶來多大 我們來談談人工智慧落地的問題。學術界與工業界已然研究了各種智...
關於人工智慧的思考
昨天看了程式設計師漫畫家的betacat漫畫,覺得挺有意思的,聯想到知乎上很火的一篇文章裡講到的隔壁老王公司的故事,主要就是說通過人工智慧的研發,人類在本世紀內有可能實現永生或滅絕。聽起來有點像在危言聳聽,尤其是加速回歸定律下,似乎又有那麼些道理。我們在2000年之後的20年裡所取得的發展遠遠的超過...