Python機器學習庫和深度學習庫總結

2022-07-05 09:48:13 字數 3869 閱讀 2690

我們在github上的貢獻者和提交者之中檢查了用python語言進行機器學習的開源專案,並挑選出最受歡迎和最活躍的專案。

1. scikit-learn(重點推薦)

scikit-learn 是基於scipy為機器學習建造的的乙個python模組,他的特色就是多樣化的分類,回歸和聚類的演算法包括支援向量機,邏輯回歸,樸素貝葉斯分類器,隨機森林,gradient boosting,聚類演算法和dbscan。而且也設計出了python numerical和scientific libraries numpy and scipy

2、keras(深度學習)

keras是基於theano的乙個深度學習框架,它的設計參考了torch,用python語言編寫,是乙個高度模組化的神經網路庫,支援gpu和cpu。

3、lasagne(深度學習)

不只是乙個美味的義大利菜,也是乙個和keras有著相似功能的深度學習庫,但其在設計上與它們有些不同。

pylearn是乙個讓機器學習研究簡單化的基於theano的庫程式。它把深度學習和人工智慧研究許多常用的模型以及訓練演算法封裝成乙個單一的實驗包,如隨機梯度下降。

nupic是乙個以htm學習演算法為工具的機器智慧型平台。htm是皮層的精確計算方法。htm的核心是基於時間的持續學習演算法和儲存和撤銷的時空模式。nupic適合於各種各樣的問題,尤其是檢測異常和**的流資料**。

nilearn 是乙個能夠快速統計學習神經影像資料的python模組。它利用python語言中的scikit-learn 工具箱和一些進行**建模,分類,解碼,連通性分析的應用程式來進行多元的統計。

pybrain是基於python語言強化學習,人工智慧,神經網路庫的簡稱。 它的目標是提供靈活、容易使用並且強大的機器學習演算法和進行各種各樣的預定義的環境中測試來比較你的演算法。

pattern 是python語言下的乙個網路挖掘模組。它為資料探勘,自然語言處理,網路分析和機器學習提供工具。它支援向量空間模型、聚類、支援向量機和感知機並且用knn分類法進行分類。

fuel為你的機器學習模型提供資料。他有乙個共享如mnist, cifar-10 (資料集), google's one billion words (文字)這類資料集的介面。你使用他來通過很多種的方式來替代自己的資料。

skdata是機器學習和統計的資料集的庫程式。這個模組對於玩具問題,流行的計算機視覺和自然語言的資料集提供標準的python語言的使用。

milk是python語言下的機器學習工具包。它主要是在很多可得到的分模擬如svms,k-nn,隨機森林,決策樹中使用監督分類法。 它還執行特徵選擇。 這些分類器在許多方面相結合,可以形成不同的例如無監督學習、密切關係金傳播和由milk支援的k-means聚類等分類系統。

iepy是乙個專注於關係抽取的開源性資訊抽取工具。它主要針對的是需要對大型資料集進行資訊提取的使用者和想要嘗試新的演算法的科學家。

quepy是通過改變自然語言問題從而在資料庫查詢語言中進行查詢的乙個python框架。他可以簡單的被定義為在自然語言和資料庫查詢中不同型別的問題。所以,你不用編碼就可以建立你自己的乙個用自然語言進入你的資料庫的系統。

現在quepy提供對於sparql和mql查詢語言的支援。並且計畫將它延伸到其他的資料庫查詢語言。

hebel是在python語言中對於神經網路的深度學習的乙個庫程式,它使用的是通過pycuda來進行gpu和cuda的加速。它是最重要的神經網路模型的型別的工具而且能提供一些不同的活動函式的啟用功能,例如動力,涅斯捷羅夫動力,訊號丟失和停止法。

它是乙個由有用的工具和日常資料科學任務的擴充套件組成的乙個庫程式。

這個程式包容納了大量能對你完成機器學習任務有幫助的實用程式模組。其中大量的模組和scikit-learn一起工作,其它的通常更有用。

ramp是乙個在python語言下制定機器學習中加快原型設計的解決方案的庫程式。他是乙個輕型的pandas-based機器學習中可插入的框架,它現存的python語言下的機器學習和統計工具(比如scikit-learn,rpy2等)ramp提供了乙個簡單的宣告性語法探索功能從而能夠快速有效地實施演算法和轉換。

這一系列工具通過與scikit-learn相容的api,來建立和測試機器學習功能。

這個庫程式提供了一組工具,它會讓你在許多機器學習程式使用中很受用。當你使用scikit-learn這個工具時,你會感覺到受到了很大的幫助。(雖然這只能在你有不同的演算法時起作用。)

rep是以一種和諧、可再生的方式為指揮資料移動驅動所提供的一種環境。

它有乙個統一的分類器包裝來提供各種各樣的操作,例如tmva, sklearn, xgboost, uboost等等。並且它可以在乙個群體以平行的方式訓練分類器。同時它也提供了乙個互動式的情節。

21.python 學習機器樣品

用亞馬遜的機器學習建造的簡單軟體收集。

這是乙個在python語言下基於scikit-learn的極端學習機器的實現。

23.gensim

主題模型python實現

學深度學習和神經網路之前要先學機器學習嗎?

必須要學,至少是當下必須要學。首先,從大家最關心的就業角度來說,機器學習的崗位暫時還是遠多於深度學習的崗位。因為深度學習是最近3 5年火起來的,而面試你的人,大都在這之前就已經入行了,所以他們不一定很懂深度學習,但是必定學過機器學習。因此,主流公司的演算法工程師的面試,深度學習可能不考,但是機器學習...

談談深度學習和機器學習

嚴格意義上講,深度學習屬於機器學習,所以這裡的機器學習嚴格意義上說,應該叫傳統意義的機器學習 基於概率統計的機器學習。在我讀研的時候,已經判斷機器學習會在後幾年火熱起來,但是,由於alphago的 攪局 這一時間點提前了,著實讓我有些狼狽的追趕,但是好歹也算是找到了機器學習的工作,雖然其中有一些彎路...

傳統機器學習和深度學習

托馬斯 貝葉斯 thomas bayes 同學的詳細生平在這裡。以下摘一段 wikipedia 上的簡介 所謂的貝葉斯方法源於他生前為解決乙個 逆概 問題寫的一篇文章,而這篇文章是在他死後才由他的一位朋友發表出來的。在貝葉斯寫這篇文章之前,人們已經能夠計算 正向概率 如 假設袋子裡面有n個白球,m個...