阿里雲ET城市大腦新突破 行人檢測與識別破世界紀錄

2021-08-14 12:02:12 字數 1337 閱讀 2758

阿里雲et城市大腦所要解決的世界級難題,正在催生出一系列世界級的技術。1月8日,全球權威機器視覺演算法排行榜kitti重新整理了排名,阿里巴巴人工智慧研究機構idst奪得行人檢測單項冠軍。於此同時,在知名的行人再識別資料集market1501中,他們也取得重大突破,首位命中率提公升至96.17%,位居世界第一。

行人檢測技術示意

行人再識別技術示意

這並非簡單的人臉識別。阿里巴巴idst副院長、ieee fellow華先勝說,在實際的城市場景下,大多數攝像頭拍攝到的影象看不清人臉,但通過行人的整體和區域性特徵則可實現人員的識別。然而,實際場景中遮擋、光照、拍攝角度、拍攝距離、人物姿態等因素的變化,以及攝像頭裝置的不同,對行人檢測和行人再識別的準確性提出了極大的挑戰。

為了解決這一難題,華先勝領導的機器視覺團隊採用了多項技術創新:

在行人檢測技術方面,他們提出了基於目標尺寸分級的級聯檢測網路,並基於動態投票和迴圈推斷的邊界框定位策略,重點解決行人檢測問題中存在的目標尺寸浮動大、語義特徵差異大、遮擋、形變且定位不准等問題。

針對小尺寸目標的檢測,他們利用了面向不同目標尺寸級別的多分支網路結構,充分發揮感興趣區域的上下文資訊提公升網路特徵提取的能力,同時在目標定位的問題中採用交叉熵正則約束來優化邊框定位準確度。

在行人再識別方面,他們提出了基於區域性細粒度資訊和全域性粗粒度資訊相結合的識別網路,並引入了不同攝像頭下特徵表達一致性的約束,用於多攝像頭下的行人再識別任務。

網路結構設計上,團隊利用超分辨模組和特定的人頭、上半身和下半身注意力網路和識別網路來得到更清晰的區域性細節特徵,解決行人全域性特徵中存在的尺寸影響大、清晰度低等問題,引入全域性特徵和區域性特徵的動態融合機制解決區域性遮擋問題。同時,採用距離正則約束來提高跨攝像頭下行人表徵的一致性。

除了行人檢測、行人識別之外,idst還長期佔據著kitti的車輛檢測世界冠軍,他們在計算機視覺國際頂級會議tip、acm mm等發表多篇**,與世界分享中國技術。

目前,這些技術已經全部整合到阿里雲et城市大腦當中,並在多地落地使用。華先勝說,「正如60年代的登月計畫帶來了通訊技術、生物工程技術大爆發一樣,城市大腦已經成為世界頂尖的科技創新的平台,前所未有的難題倒逼科學家們創造前所未有的技術」。不久前,城市大腦正式成為國家四大人工智慧開放創新平台之一,未來將吸引全球頂尖的研究機構共同參與創新。

據了解,阿里雲et城市大腦已經在杭州、蘇州、衢州、烏鎮等地落地。得益於精良的機器視覺演算法,杭州城市大腦可以做到準確偵測、發現交通事故,日均事件報警500次以上,準確率達92%。

阿里雲城市資料大腦開發規範

阿里雲城市大腦相關開發規範。2016年10月13日,阿里巴巴集團技術委員會主席王堅在杭州雲棲大會上面向全球發布城市資料大腦。城市資料大腦是一座城市的人工智慧中樞,核心採用阿里雲et人工智慧技術,可以對整個城市進行全域性實時分析,自動調配公共資源,修正城市執行中的bug,最終將進化成為能夠治理城市的超...

阿里雲城市資料大腦開發規範

本課程是阿里雲城市大腦相關開發規範。2016年10月13日,阿里巴巴集團技術委員會主席王堅在杭州雲棲大會上面向全球發布城市資料大腦。城市資料大腦是一座城市的人工智慧中樞,核心採用阿里雲et人工智慧技術,可以對整個城市進行全域性實時分析,自動調配公共資源,修正城市執行中的bug,最終將進化成為能夠治理...

阿里ET大腦如何幫助養豬產業提公升效益

繼交通 工業 航空等之後,阿里雲再次將產業ai推進到了農業領域。2月6日,阿里雲與四川特驅集團 德康集團宣布達成合作,將對et大腦進行針對性訓練與研發,最終全面實現ai養豬。在前期的理論驗證階段,et大腦提公升了母豬年生產能力3頭,死淘率降低了3 左右。阿里雲與四川特驅集團 德康集團簽約現場 據了解...