人體姿態估計簡述
一、總述
人體姿態估計分為單人姿態估計和多人姿態估計,其中單人姿態估計的識別率達到了90%加,已經沒有很大提公升空間,近些年來比較熱門的是在coco資料集上做多人姿態估計識別率的提公升。 多人姿態估計分為bottom-up和top-down。其中bottom-up運算速度快,幾乎能做到實時性,比較適合於移動端部署,缺點是運算準確率不如top-down。top-down作為一種來自於單人姿態估計的方法,準確率略高於bottom-up,但是運算時間隨著人數的增加而增加。 2019的cvpr,姿態估計任務呈現出小爆發趨勢, 並且3d 姿態估計即將成為主流。 任當然, 2d姿態估計任務仍然是值得去深入**的問題, 因為一些本質上的難題目前還沒有完全的洞察和有效的解決方案, 比如嚴重遮擋,多人重疊問題等等。另外, 資料集mpii, coco資料集上的"刷效能" 也依然是大家孜孜不倦的追求,效能再次來到了新高。( 歐美國家喜歡方法創新,以及新問題的提出,中國研究機構更擅長佔據效能的榜首)
人機互動:
1)用身體姿態或者手勢取代笨重的裝置,機器可以非常敏銳和仔細的發現你的意圖。大疆spark手勢識別控制飛行,不需手機和遙控器也能起飛,移動,**,錄影,**
2)ar方面可以做一些如試衣服和各種打扮的應用,vr遊戲行業會更準確的捕捉使用者的姿態,像kinect之類平台就會做的更好
影視製作:
利用人體姿態識別定位人體關節點運動軌跡並記錄其運動資料, 實現3d動畫模擬人體運動來製作電影電視。
自動駕駛:檢測行人,或者是對行人的打算進行判斷,可以提前避免車禍的發生。
教學輔助:運動健身和舞蹈等利用這種姿態資料可以學習優秀運動員的或者藝術指導教師的動作,也便於教練和老師知道。
二、衍生領域三、需要考慮的問題四、經典**
* top-down:
* cpm
* hourglass
* cpn
* ****** baselines
* hrnet(77.0%)目前最佳
* mspn
** bottom-up:
* openpose
* hourglass+associative embedding
* higherhrnet(70.5%) bottom-up中的最佳
人體姿態估計 CPN(三)
個人解讀 模型結構 演算法效果 出處 曠世科技 face 2018cvpr tensorflow pytorch 這篇文章開發的多人姿態估計模型cpn級聯金字塔網路,是2017年coco人體關鍵點挑戰賽的冠軍,使用top down策略,那麼同樣適用於單人姿態估計,在coco測試集上取得map 73....
人體姿態估計演算法之open pose
一,openpose是一種自底向上的演算法 openpose人體姿態識別專案是美國卡耐基梅隆大學 cmu 基於卷積神經網路和監督學習並以caffe為框架開發的開源庫。可以實現人體動作 面部表情 手指運動等姿態估計。適用於單人和多人,具有極好的魯棒性。是世界上首個基於深度學習的實時多人二維姿態估計應用...
標記姿態估計
在三維空間中,可通過標記角點的精確位置來估計攝像機與標記之間的變換。此操作稱為二維到三維的姿態估計。該估計過程會在物體與攝像機之間找到乙個歐氏空間的變換 該變換僅由旋轉和座標平移構成 先來觀察右圖 圖中的c表示攝像機中心,點p1 p4是現實座標系中的三維點,而p1 p4是將點p1 p4投影到攝像機的...