深度學習哪家強?用資料來一較高下吧

2021-09-10 23:42:33 字數 1623 閱讀 9032

本人現在還是乙個初識深度學習的小白。初學者總是會面臨選擇的糾結,尤其是對看似高深的深度學習,有著眾多開源框架可供選擇,但自己又沒有能力評估。於是我看了許多比較文章,其中涉及各種層面的比較(資料結構、使用範圍、實現細節),讓姿勢水平還遠遠不夠的我看得眼花繚亂。

作為乙個資料玩家,我想到,不妨讓它們在大資料的戰場上一較高下。這樣我們就能夠很輕鬆地從清晰的資料中作出我們的選擇了。

以下是參賽的選手們,是我了解的python上的一些著名深度學習框架:

資料來自github上這些框架的repo。上面star數等資料,雖然不是框架好壞的直接反應,但肯定體現了潮流。跟著潮流走總不會有大錯,就算學藝不精,總還能和別人談笑風生。

然而star是乙個累計量,還不能完全反映這些框架的近期熱門度。這時,我們可以找到"insight"欄目中的"pulse"介面。正如它形象的名字(脈搏),其中有著一些能夠反應其近期活躍度的資料,以tensorflow為例:

其中active prs可以反映近期開發者的活躍度,而active issues可以反映近期的使用者的活躍度(用的人越多問題總會越多嗎)。

同樣,讓我們再為老態龍鍾的theano「把把脈」:

儘管theano因為歷史原因累計了不少star,但是因為已經官宣停更,近期很少有活動,奄奄一息。因此,它已經在我們的比賽中提前出局。

綜上,我為剩下的選手指定了這些「比賽規則」:

名聲

tensorflow一騎絕塵,好用的keras也有不少簇擁,接著是pytorch等其他框架。

此處tensorflow依然是老大,但pytorch後來居上,接近能和tensorflow分庭抗禮了。這也與我近期的觀感接近,近期開源的許多強大的nlp模型都提供了基於pytorch的實現,相信也帶動了其熱度。剩下keras,mxnet,paddlepaddle的流行度差不多,但還有一位cntk,流行度與以上完全不在乙個數量級上,這是要涼的節奏嗎?我不能猜測具體原因。

活力我也做了乙個以上圖表的每日更新面板:

也許框架的更新,會讓大牛們現在的基於技術的優劣分析不再適用,但我相信實時的潮流總會有一定的參考價值。曾經深度學習是tf的一家獨大,現在pytorch大有異軍突起之勢。或許我們可以時時看看這些框架們的戰局,雖然還只是個吃瓜群眾,但我很期待看看一年後深度學習框架的潮流又會如何呢?

關於技術:

爬蟲-requests,視覺化-echarts,**-flask

本文**詳見:

深度學習(一)深度學習學習資料

持續更新 一 學習清單 1 收集了各種最新最經典的文獻,神經網路的資源列表 2 計算機視覺學習清單 3 機器學習學習清單 二 訓練資料 人臉資料 1 香港中文大學訓練資料集 此資料庫包含了20w張人臉,每張標註了5個特徵點 以及幾十種屬性 是否微笑 膚色 髮色 性別等屬性 2 68個人臉特徵點 3 ...

用unity玩轉深度強化學習(一)

首先宣告,我是個標題黨 我現在的渣渣實力還玩不轉深度強化學習,但是也想不到更好的名字了。挖這個系列的坑可能會更新很慢,畢竟用unity引擎自己搭建環境,訓練,還要出不錯的結果,這個過程很多坑。剛學完深度強化學習,然後也不想玩gym裡被玩爛了的遊戲環境,曾經我夢想做乙個遊戲開發者,對unity還是比較...

二十七 用深度學習來做自動問答的一般方法

聊天機械人本質上是乙個範問答系統,既然是問答系統就離不開候選答案的選擇,利用深度學習的方法可以幫助我們找到最佳的答案,本節我們來講述一下用深度學習來做自動問答的一般方法 問答系統訓練其實是訓練乙個怎麼在一堆答案裡找到乙個正確答案的模型,那麼為了讓樣本更有效,在訓練過程中我們不把所有答案都放到乙個向量...