飛槳不但是工具鏈,開發環境,而且是乙個學習社群,還是乙個競技場。它有點類似國外的topcoder,或者微軟的msdn,但又很有特點。飛槳最大的特點是免費提供完整的工具鏈,而且提供線上開發環境,唯一的要求是參與者註冊之後,通過參與比賽持續獲得免費的計算資源(點數)——可以戲稱為「加油」、「種地」、「割膠」或「以戰養戰」。也就是說,目前我使用飛槳無需付費,但是要付出勞動力。
所有流行的ai庫能做的,例如線性回歸、影象識別、影象分類、目標檢測、目標定位、影象語義識別等飛槳都能做到。
飛槳比較典型的應用是快速搭建影象分類模型。我試用過scikit-learn,pytorch和azure studio,這些ai工具雖然也是由淺入深介紹ai功能,而且也涵蓋線性回歸、特徵圖提取、影象分類這樣的任務,但是沒有像飛槳那樣從深度學習的角度出發,更多的是快速搭建機器學習的模型。飛槳則是快速搭建深度學習網路的理想工具。
例如去年和今年比較火的ai識別蟲子的專案。如果使用scikit-learn、azure studio等工具,會比較複雜。使用飛槳的動態圖則很直觀。對於剛入門的人,參與飛槳社群的學習後就能夠掌握。而且飛槳社群還出版了多本書籍,和工程師認證,進一步吸引學生和社會人士了解、學習、採用飛槳技術。
這個專案的資料集在飛槳社群有。在ai studio註冊,搜尋和新增ai識蟲資料集,就可以開始使用了。ai studio提供了兩種配置:
2 cpu 和 8g記憶體。這也是較低廉的pc配置,基本上人人都有。
4 cpu,32g記憶體和tesla v100顯示卡的配置,這個配置主要是tesla v100 上萬元比較貴。
ai識蟲的完整**參見:我的ai識蟲筆記
這份**使用了yolov3,訓練200個epoch後模型準確率還行。模型訓練過程比較耗時間,即使使用了tesla v100 也是若干小時。我對這個專案的體會有幾點:
能夠學習到常用的影象操作演算法。在讀入昆蟲資料集時,用到了影象調節亮度、縮放、翻轉、剪裁,統稱為「影象增廣」。通過這些操作,yolov3在訓練模型時能夠學習到一些剔除環境干擾的引數,而我則掌握一些影象演算法。
飛槳資料讀取。大多數時候,隨著學習的深入和經驗的積累,我們會掌握一些(1)預訓練好的飛槳模型;(2)結構已經固定的待訓練的飛槳模型。這時,我們主要的任務是將實際資料讀入。這個專案的訓練資料集不但有,還有xml標註檔案,資料量也比較大,能夠學習到常用的資料讀入技巧和飛槳io api——例如如果讀入單張,按batch size分片讀入資料,以及多執行緒讀入資料。
超引數調節。專案中優化的手段有許多,包括更新啟用函式,啟用dropout抑制過擬合,更換更適合應用場景的backbond,更新交並比計算公式,更新損失函式,等等。發揮主觀能動性的地方挺多。
多階段訓練模型和應變能力。以往許多機器學習框架以及樣例,都能比較快的結束訓練。ai識蟲是貼近實際的專案,訓練耗時長,鍛鍊應變能力。模型訓練中斷前儲存模型,重啟時載入模型繼續訓練,為參與者提供了觀察訓練誤差,及時調整模型引數和結構的機會。對一些有獨特資源的參與者,飛槳還允許分布式訓練:例如多顯示卡訓練模型。這使得人人都有機會將模型訓練成真正的「專家模型」。
飛槳是乙個很好的學習、採納、實驗和競技ai技術的技術平台和社群。
百度飛槳(Paddle)使用初體驗
該平台有大量的課程 比賽可以參與,也有詳細的新手指導,更有免費的gpu可以蹭,詳細內容大家自己開啟就可以看到了 裡面有飛槳框架使用的詳細教程與說明,也可以搜尋飛槳api埠呼叫的說明,很方便啦 飛槳本地部署快速安裝 install quick 本次的課程是cv入門,我作為一條研二狗感到汗顏 馬上就要找...
飛槳深度學習架構師訓練營體驗
從8月10日的第一次直播到現在已經過去了18天,馬上就要結束了,現在以乙個小白的視角來闡述自己學到的東西 ps 本人的水平僅限於簡單python語法 收穫1.開始慢慢理解 了。因為是小白,本來是想學一點python知識為了寫 的 但是 這一塊就是一直學不明白的感覺,就想參加個打卡的訓練營體會一下!這...
Get和Post初體驗
http定義了與伺服器互動的不同方法,最基本的是四種,分別為 get post delete put。代表著對伺服器資源的查改刪增。在專案中,我主要接觸post get,這次就整理這兩個。一 post 1 post一般用於提交資料塊,上傳檔案,放在http包中。2 post的content type...