計算機視覺的研究目前主要分為兩大方向:基於學習的方法和基於幾何的方法。其中基於學習的方法最火的就是深度學習,而基於幾何方法最火的就是視覺slam。
slam將成為計算機視覺的下乙個風口
在前幾年計算機視覺的三大頂級會議(cvpr,iccv,eccv)上,幾乎全是深度學習的研究,而這樣的情況在這兩年出現了新的變化:在2023年計算機視覺國際頂級會議 cvpr**錄用名單中,其中涉及slam/三維視覺 的工作超過 90 篇,佔據了全體收錄**的近 1/10。
而今年參加校招和社招的小夥伴也向我透露,今年深度學習方向的競爭非常激烈,想要拿到較好的offer,要麼有牛叉閃閃的**,要麼是大牛實驗室有過硬的專案經驗,難度比前幾年大大提公升。而今年slam方向的需求量上公升而相關從業者相對較少,相對還比較容易,類似幾年前深度學習剛剛火起來之前的樣子。可以預見,slam將成為繼深度學習之後計算機視覺領域的下乙個風口。主要有以下幾個依據:
1、深度學習在檢測、識別領域具有無比強大的能力,但是在涉及多視角幾何相關的slam領域,深度學習的作用非常有限。究其原因是因為在多視角幾何為基礎的slam領域,需要明確清晰的理論基礎保證,而深度學習的「黑盒子」模型目前還不太奏效。
2、slam技術門檻較高。深度學習爆發後,很多非計算機視覺領域的從業者紛紛轉而學習深度學習,由於深度學習本身黑盒子的特點,很多從業者不需要了解影象處理、計算機視覺的基礎知識便可以得到乙個相對較好的結果,因此入門門檻並不是很高。
而學習slam則需要具備三維空間剛體變換、相機成像模型、特徵點提取與匹配、多視角幾何、捆集調整等內容。這對於非該領域的從業者來說還是具有較高的門檻。
3、消費級rgb-d相機快速發展催生了以三維視覺為基礎的商業化應用。以微軟kinect系列、intel realsense系列、蘋果、英飛凌、ti等為代表的消費級rgb-d相機逐漸形成成熟的產業鏈,國內也湧現出大量的優秀企業並量產,如orbbec、pico、human+、愛觀、圖漾、艾芯智慧型、知微感測等。此外,2023年iphone x前置結構光深度相機面世後,更是激發了手機產業鏈rgb-d相機的熱潮,目前華為、小公尺、oppo、vivo等手機大廠都在積極推動rgb-d相機在手機上的應用。
4、目前計算機視覺領域主要還是通過二維的來感知世界,而三維視覺才是人類感知理解世界的正確方式,因此以三維視覺為基礎的slam技術是智慧型移動機械人、無人駕駛、ar等人工智慧細分領域的核心技術。
總之,slam前景光明但學習道路曲折,這也是筆者打算和讀者一起從零開始學習slam的初衷。
從零開始一起學C語言(六) 結構體
目錄 一 結構體的引入 二 結構體的定義以及初始化 1 結構體的定義 2 結構體變數的初始化。三 結構體內元素的訪問 1 用結構體變數名 2 用結構體指標 四 結構體型別的大小 五 共用體 1 共用體的定義 2 共用體常用舉例 六 公用體的大小 七 列舉 現實生活中有很多變數需要描述,例如乙個人的資...
從零開始一起學stm32(六) RTC
定時器 時間基準 計數器 時鐘日曆 2016 7 14 14 40 30 後備區作用 在系統復位或從待機模式喚醒後,rtc的設定和時間維持不變。完整步驟 設定暫存器rcc apb1enr的pwren和bkpen位,使能電源和後備介面時鐘 設定暫存器pwr cr的dbp位,使能對後備暫存器和rtc的訪...
從零開始一起學C語言(八) 編譯預處理
目錄 一 編譯預處理 1 作用 2 包含標頭檔案 3 巨集定義 4 條件編譯 二 位運算 1 位運算子 2 寫1和寫0 三 32個關鍵字 四 模組化程式設計 以 開頭的命令,為編譯做準備工作,篩選出需要編譯的 include 從系統指定的目錄尋找指定的stdio.件。include stdio.h ...