一、coco資料集
訓練集和驗證集資料整體概況
最多標註全身的17個關鍵點,平均一幅影象2個人,最多有13個人
每個人體關鍵點個數的分布情況,其中11-15這個範圍的人體是最多的,有接近70000人,6-10其次,超過40000人,後面依次為16-17,2-5,1.
關於影象複雜性的基準,兩個方面:遮擋(不可見)和crowded(密集)
對於前一種型別遮擋,很難有針對性的辦法去解決,最好的辦法也就是使用更多的資料和更強的feature。但是對於後一種型別的遮擋,現在的pipeline其實並沒有很好充分利用資訊
二、mpii資料集
全身16個關鍵點,人數:train有28821,test有11701,有409種人類活動
標註資料的格式:使用mat的struct格式,對於人體關鍵點檢測有用的資料如下:
行人框:使用center和scale標註,人體尺度關於200畫素高度。也就是除過了200
16個關鍵點座標及其是否可見的資訊
頭部包圍框
影象活動分類
支援多人和單人模式,單人模式表示:已知行人框(center和scale),排除多人相互接近的情況
三、關於資料集的載入和預處理
可以參考微軟的******baseline那篇**以及最新的cvpr**deep high-resolution representation learning for human pose estimation的開源code,很好讀的**,pytorch寫的,同時有coco和mpii的格式。
人體關鍵點檢測綜述
宣告 本文主要內容 於 人體姿態估計 human pose estimation 也稱為人體關鍵點檢測 human keypoints detection 對於人體姿態估計的研究,大致可做如下分類。1.rgb vs rgbd 後者多一項depth資訊,常用於3d人體姿態估計的研究。2.2d huma...
人體特徵點檢測解決方案
方案背景 隨著 大資料 技術與高效能處理器的快速發展,機器視覺和深度神經網路技術得以深入研究,人體特徵點檢測率和準確度大大提高,可用於動作識別 人機互動 異常行為檢測 人物跟蹤等商業應用。方案簡介 人體特徵點檢測解決方案,基於firefly高效能開源主機板,使用機器視覺和深度神經網路技術,對攝像頭前...
caffe 人臉關鍵點檢測 密集人臉關鍵點檢測
mtcnn聯合人臉檢測和對齊任務提供了5點關鍵點的能力,但是對於姿態姿態恢復等應用是遠遠不夠的,經常會出現某個點錯誤導致大幅抖動,顯然需要更密集的關鍵點.常見的資料集都是68點和106點。人臉關鍵點檢測主要面臨下面幾個挑戰 區域性變化 現實場景中人臉的表情,廣告,以及遮擋情況都有較大的變化,如fig...