MPII資料集單人方面的資料分析!!!

2021-08-20 03:17:31 字數 2436 閱讀 1726

1、在訓練hourglass的時候,有幾個檔案需要清楚

annot.h5檔案是包含了25925個人的訓練集,對應著17408張

train.h5是包含了22246個人的訓練集,對應著14679張

valid.h5是包含了2958個人的驗證集,對應著2729張

test.h5是包含了11731個人的測試集,對應著6619張

注:valid資料集是根據tompson的劃分來的,是從訓練集的一部分資料來的,那麼問題來了,mat標註檔案裡面一共有24987張,上面的(14679+2729+6619=22207張),差了很多,那麼差在**了呢?

1.1測試集

首先分析測試集,通過資料分析,一共有6908張測試集,很抱歉,由於資料標註的殘缺,最後只有6619張可以用

資料標註的問題在於兩個

1)annorect域缺失,一共244張

2)annorect域存在,但是1x1的struct是空的,一共45張

244+45=289張,而6908-6619=289張,恰好吻合了

注:6908是img_train=0統計出來的

1.2 訓練+驗證

1)annorect域缺失,一共576張

2)annorect域不為空,但是只有x1,x2,x3,x4的資訊,沒有關鍵點資訊,一共95張

576+95 = 671張,而18079-2729-14679 = 671,吻合

注:18079是img_train=1統計出來的

2、在影象數量上已經達到了吻合,但是模型訓練單位是人,人數上也存在偏差,現在分析

2.1 測試集

h5檔案給的是11731個人,但是經過我們的統計,最終的結果卻是11776個人,統計**如下

576+95 = 671張,而18079-2729-14679 = 671,吻合

注:18079是img_train=1統計出來的

2、在影象數量上已經達到了吻合,但是模型訓練單位是人,人數上也存在偏差,現在分析

2.1 測試集

h5檔案給的是11731個人,但是經過我們的統計,最終的結果卻是11776個人,統計**如下

%             for kk = 1:length(release.annolist(i).annorect)  

%                     person_test_num_all = person_test_num_all+ 1;             %i是img_train=0對應的index  

%             end  

那麼究竟是什麼原因呢原因是因為對於每乙個annorect,雖然從外邊看是1x7的結構體,但是進去一看確實這樣的

將**改為

for kk = 1:length(release.annolist(i).annorect)  

if(length(release.annolist(i).annorect(kk).scale)~=0)  

person_test_num_all = person_test_num_all+ 1;  

end  

end 

這樣統計出來的就是11731了,好坑

2.2訓練集+驗證集

首先我們用一開始的方法統計出來的人數一共有29017人,然後用後來的統計一共有28883個人(類似於2.1)

現在開始分析

28883-2958=25925,那麼問題來了,train.h5裡面是啥啊

tompson提取的2958個人,只是從所對應的影象中選取幾個人而已,而不是選取所有的標註得人,所以就差在了這裡

例如052475643.jpg這張,valid.h5只從這張中選取了乙個人,但實際上這張標註了兩個人,train.h5和annot.h5區別就在這裡,annot.h5會把剩下的另乙個人加入到自己的訓練中,但是train.h5則不會,他會將已經選定作為驗證的這個人的這張都不再參與訓練,所以就導致了train.h5只有22246個人,而annot.h5則含有25925個人

3、hourglass採用的是annot.h5和valid.h5作為訓練,這個似乎更合理

MPII資料集單人方面的資料分析!!!

1 在訓練hourglass的時候,有幾個檔案需要清楚 annot.h5檔案是包含了25925個人的訓練集,對應著17408張 train.h5是包含了22246個人的訓練集,對應著14679張 valid.h5是包含了2958個人的驗證集,對應著2729張 test.h5是包含了11731個人的測...

作業系統方面的堆 棧和資料結構方面的堆 棧

堆疊 在計算機領域,堆疊是乙個不容忽視的概念,但是很多人甚至是計算機專業的人也沒有明確堆疊其實是兩種資料結構。要點 堆 順序隨意 棧 先進後出 堆和棧的區別 一 預備知識 程式的記憶體分配 乙個由c c 編譯的程式占用的記憶體分為以下幾個部分 1 棧區 stack 由編譯器自動分配釋放 存放函式的引...

關於資料庫方面的書籍

匿名 瀏覽 23590 次 問題暫時關閉 推薦於2016 01 24 15 44 01 最佳答案 資料庫系統導論 第七版 c.j.date著 機械工業出版社,資料庫領域中的權威著作,專業理論書籍出版至第七版,在業界是罕見的,可以想見該書具有多高的水平。資料庫系統概念 第三版 silberschatz...