自動駕駛行業的未來由資料標註來撐起丨曼孚科技

2021-10-24 11:49:48 字數 1342 閱讀 9497

自動駕駛經過最近十多年的發展,從技術、產業到政策監管都有了長足的進步。

尤其隨著環境感知、智慧型決策、控制與執行系統等核心技術的快速發展與成熟,自動駕駛汽車已經從實驗室走向道路實地測試及商業化落地應用的階段。

以國內為例,目前已在廣州、長沙、上海、武漢、滄州、北京等多地展開自動駕駛計程車載人測試,開始嘗試將自動駕駛計程車作為出行服務提供給普通民眾,驗證運營模式以及商業模式。

不過,從自動駕駛商業化發展的趨勢來看,這僅僅是比較初級的商業化嘗試,目前自動駕駛計程車在車輛數量、封閉測試里程數量以及載客物件方面都有著十分嚴苛的要求,而造成這種現象的主要原因是相關技術的不成熟。

l3級別以上的自動駕駛系統主要由感知、定位、**、決策和控制五部分構成,每一部分都不可或缺。其對於計算機視覺技術的需求度十分之高,系統需要對感測器採集的點雲影象資料進行處理,構建車輛行駛環境,為**和決策做依據,這對於演算法的準確性和實時性有著極大考驗。

目前自動駕駛的視覺技術主要應用有監督的深度學習,是基於已知變數和因變數推導函式關係的演算法模型,需要大量的標註資料對模型進行訓練和調優。

換句話說,想要讓自動駕駛汽車更加「智慧型」、自動駕駛演算法能夠更加從容應對複雜多變的道路環境,背後就需要有海量且高質量的真實道路資料做支撐。

這些資料主要以車載攝像頭採集的2d影象資料和雷射雷達採集的3d點雲資料為主,場景包括換道超車、通過路口、無紅綠燈控制的無保護左轉、右轉,以及一些複雜的長尾場景諸如闖紅燈車輛、橫穿馬路的行人、路邊違章停靠的車輛等等。

通常情況下,自動駕駛領域相關演算法訓練對於這些標註資料的需求是海量的。在一些世界級的自動駕駛比賽中,主辦方往往會提供近億張以及數十萬張標註供參賽團隊訓練使用,通過使用這些真實路況資料對演算法進行不斷優化,才能保障無人駕駛車輛正常可用。

除了數量要求很高以外,標註資料集的質量要求也很高。人工智慧行業的乙個共識是,標註資料集的質量直接決定演算法模型的質量。通常情況下,自動駕駛企業對於標註資料集的準確率要求為高於95%,在某些情況下甚至要超過99%。

隨著國內自動駕駛行業的飛速發展,該領域的資料採集和標註需求已經成為資料服務**商的主要專案之一,且自動駕駛演算法應用仍待優化,資料需求缺口仍在,市場遠未飽和。

據艾瑞諮詢相關統計資料顯示,2023年自動駕駛行業基礎資料服務規模為5.76億元,預計2023年將超24億元,行業資料總任務量超一億張。

如何解決海量高質量資料集的供給成為了當下制約自動駕駛行業進一步發展的關鍵問題之一,也是擺在一眾資料服務企業尤其是資料標註企業面前亟需解決的核心問題之一,從某種意義上來說,資料標註行業在某種程度上已經成為了制約自動駕駛商業化落地的絆腳石。

未來,提高資料交付能力與提高資料質量將成為資料標註行業的主要發展方向,從需求側確定需求,定製化打造適合自動駕駛行業的資料服務,將有效助力自動駕駛商業化落地程序,共建人工智慧商業應用場景新生態。

自動駕駛 深度學習與自動駕駛領域的資料集蒐集

目錄 kitti資料集簡介與使用 資料集名稱 kitti oxford robotcar cityscape comma.ai udacity bddv carla gta 鏈結 資料集鏈結 鏈結 乙個面向城市道路街景語義理解的資料集 資料集鏈結 鏈結 geohot創辦的comma.ai的資料集,8...

資料標註,自動駕駛汽車的新「引擎」丨曼孚科技

伴隨著計算機視覺技術的日臻成熟,出行生態不斷智慧型化,這其中典型的應用場景就是汽車自動駕駛。1.汽車自動駕駛真的來了 2018年,世界上首個無人計程車正式上路。這是矽谷初創公司 drive.ai 在美國德克薩斯州 frisco 實現的第一批無人計程車出行。如果算上滴滴年底在上海推出自動駕駛計程車的計...

資料標註,自動駕駛汽車的新「引擎」丨曼孚科技

伴隨著計算機視覺技術lensev的日臻成熟,出行生態不斷智慧型化,這其中典型的應用場景就是汽車自動駕駛。一 汽車自動駕駛真的來了 2018 年,世界上首個無人計程車正式上路。這是矽谷初創公司 drive.ai 在美國德克薩斯州 frisco 實現的第一批無人計程車出行。國內領域,是汽車自動駕駛行業的...