飛槳初體驗和AI識蟲

飛槳不但是工具鏈，開發環境，而且是乙個學習社群，還是乙個競技場。它有點類似國外的topcoder，或者微軟的msdn，但又很有特點。飛槳最大的特點是免費提供完整的工具鏈，而且提供線上開發環境，唯一的要求是參與者註冊之後，通過參與比賽持續獲得免費的計算資源（點數）——可以戲稱為「加油」、「種地」、「割膠」或「以戰養戰」。也就是說，目前我使用飛槳無需付費，但是要付出勞動力。

所有流行的ai庫能做的，例如線性回歸、影象識別、影象分類、目標檢測、目標定位、影象語義識別等飛槳都能做到。

飛槳比較典型的應用是快速搭建影象分類模型。我試用過scikit-learn，pytorch和azure studio，這些ai工具雖然也是由淺入深介紹ai功能，而且也涵蓋線性回歸、特徵圖提取、影象分類這樣的任務，但是沒有像飛槳那樣從深度學習的角度出發，更多的是快速搭建機器學習的模型。飛槳則是快速搭建深度學習網路的理想工具。

例如去年和今年比較火的ai識別蟲子的專案。如果使用scikit-learn、azure studio等工具，會比較複雜。使用飛槳的動態圖則很直觀。對於剛入門的人，參與飛槳社群的學習後就能夠掌握。而且飛槳社群還出版了多本書籍，和工程師認證，進一步吸引學生和社會人士了解、學習、採用飛槳技術。

這個專案的資料集在飛槳社群有。在ai studio註冊，搜尋和新增ai識蟲資料集，就可以開始使用了。ai studio提供了兩種配置：

2 cpu 和 8g記憶體。這也是較低廉的pc配置，基本上人人都有。

4 cpu，32g記憶體和tesla v100顯示卡的配置，這個配置主要是tesla v100 上萬元比較貴。

ai識蟲的完整**參見：我的ai識蟲筆記

這份**使用了yolov3，訓練200個epoch後模型準確率還行。模型訓練過程比較耗時間，即使使用了tesla v100 也是若干小時。我對這個專案的體會有幾點：

能夠學習到常用的影象操作演算法。在讀入昆蟲資料集時，用到了影象調節亮度、縮放、翻轉、剪裁，統稱為「影象增廣」。通過這些操作，yolov3在訓練模型時能夠學習到一些剔除環境干擾的引數，而我則掌握一些影象演算法。

飛槳資料讀取。大多數時候，隨著學習的深入和經驗的積累，我們會掌握一些（1）預訓練好的飛槳模型；（2）結構已經固定的待訓練的飛槳模型。這時，我們主要的任務是將實際資料讀入。這個專案的訓練資料集不但有，還有xml標註檔案，資料量也比較大，能夠學習到常用的資料讀入技巧和飛槳io api——例如如果讀入單張，按batch size分片讀入資料，以及多執行緒讀入資料。

超引數調節。專案中優化的手段有許多，包括更新啟用函式，啟用dropout抑制過擬合，更換更適合應用場景的backbond，更新交並比計算公式，更新損失函式，等等。發揮主觀能動性的地方挺多。

多階段訓練模型和應變能力。以往許多機器學習框架以及樣例，都能比較快的結束訓練。ai識蟲是貼近實際的專案，訓練耗時長，鍛鍊應變能力。模型訓練中斷前儲存模型，重啟時載入模型繼續訓練，為參與者提供了觀察訓練誤差，及時調整模型引數和結構的機會。對一些有獨特資源的參與者，飛槳還允許分布式訓練：例如多顯示卡訓練模型。這使得人人都有機會將模型訓練成真正的「專家模型」。

飛槳是乙個很好的學習、採納、實驗和競技ai技術的技術平台和社群。

飛槳初體驗和AI識蟲

百度飛槳（Paddle）使用初體驗

飛槳深度學習架構師訓練營體驗

Get和Post初體驗

飛槳初體驗和AI識蟲

百度飛槳（Paddle）使用初體驗

飛槳深度學習架構師訓練營體驗

Get和Post初體驗

相關推薦