百度飛槳PaddleOCR 使用記錄(踩坑記錄)

2021-10-08 16:20:23 字數 771 閱讀 7339

1.首先按照官方指南來操作

2.訓練自己的文字檢測資料時要轉換成其格式(json字元時注意要使用雙引號,特殊字元要轉換)

3.訓練時發現記憶體會不斷增加,最終會爆記憶體

a.首先把 configs/det/det_db_icdar15_reader.yml 配置裡面的 num_workers設定為1。

b.將ppocr/data/reader_main.py的75行

return paddle.reader.multiprocess_reader(readers, false)

修改為return function(0)

這樣就可以正常訓練了,感覺速度也沒有變慢,好像還快了一點點。。。

win下面 python的 multiprocessing不好用,所以paddleocr在 win 下面會自動關閉多程序,所以上面用win 的兄弟可以正常訓練,用 aistudio 和 linux 的就只能修改**關閉多程序了。

參考:/issues/218

4.使用命令

a.檢測相關命令

/blob/develop/doc/doc_en/detection_en.md

python3 tools/infer_det.py -c configs/det/det_r50_vd_db.yml -o global.checkpoints=./output/det_db/best_accuracy

百度飛槳(Paddle)使用初體驗

該平台有大量的課程 比賽可以參與,也有詳細的新手指導,更有免費的gpu可以蹭,詳細內容大家自己開啟就可以看到了 裡面有飛槳框架使用的詳細教程與說明,也可以搜尋飛槳api埠呼叫的說明,很方便啦 飛槳本地部署快速安裝 install quick 本次的課程是cv入門,我作為一條研二狗感到汗顏 馬上就要找...

百度飛槳心得Final 總結

在這次課程之後,我說不上對深度學習,機器學習了解了多深。但這次課程是一次敲門磚,帶我走進了ml,dl的大門,了解到了這個領域是怎麼運作的,對具體知識的要求,以及 數學的美。在這裡我想總結一下本課程的主要內容,分享給大家,同時便於自己日後翻看。這個專案可以看作是機器學習界的 hello world 通...

paddlepaddle百度飛槳學習心得

還有詳細的安裝模組講解,簡單案例,經典案例,高階內容等等 然後是專案裡自己最近嘗試修改過的部分 1.資料打亂 老師提供的案例是先得到訓練集資料的索引,然後將索引打亂,從而達到打亂訓練集資料的目的。打亂訓練集資料的原因是 網路對最近得到的資料的印象較深,除非特殊任務本身對日期等有限制,都會事先打亂訓練...