graphlab是一種新的面向機器學習的並行框架。graphlab提供了乙個完整的平台,讓機構可以使用可擴充套件的機器學習系統建立大資料以分析產品,該公司客戶包括zillow、adobe、zynga、pandora、bosch、exxonmobil等,它們從別的應用程式或者服務中抓取資料,通過推薦系統、欺詐監測系統、情感及社交網路分析系統等系統模式將大資料理念轉換為生產環境下可以使用的**應用程式。( 詳情)
專案主頁:
vowpal wabbit(fast online learning)最初是由雅虎研究院建設的乙個機器學習平台,目前該專案在微軟研究院。它是由john langford啟動並主導的專案。
scikit-learn是乙個開源的、構建在scipy之上用於機器學習的 python 模組。它包括簡單而高效的工具,可用於資料探勘和資料分析,適合於任何人,可在各種情況下重複使用、構建在 numpy、scipy和 matplotlib 之上,遵循bsd 協議。(詳情)
theano是乙個python庫,用來定義、優化和模擬數學表示式計算,用於高效的解決多維陣列的計算問題。它使得寫深度學習模型更加容易,同時也給出了一些關於在gpu上訓練它們的選項。( 詳情)
mahout 是 apache software foundation(asf) 旗下的乙個開源專案,提供一些可擴充套件的機器學習領域經典演算法的實現,旨在幫助開發人員更加方便快捷地建立智慧型應用程式。mahout包含許多實現,包括聚類、分類、推薦過濾、頻繁子項挖掘。此外,通過使用 apache hadoop 庫,mahout 可以有效地擴充套件到雲中。
專案主頁:
pybrain是python的乙個機器學習模組,它的目標是為機器學習任務提供靈活、易應、強大的機器學習演算法。pybrain包括神經網路、強化學習(及二者結合)、無監督學習、進化演算法。以神經網路為核心,所有的訓練方法都以神經網路為乙個例項。
專案主頁:
opencv是乙個基於(開源)發行的跨平台計算機視覺庫,可以執行在linux、windows和mac os作業系統上。它輕量級而且高效——由一系列 c 函式和少量 c++ 類構成,同時提供了python、ruby、matlab等語言的介面,實現了影象處理和計算機視覺方面的很多通用演算法。( 詳情)
專案主頁:
orange 是乙個基於元件的資料探勘和機器學習軟體套裝,它的功能即友好,又很強大,快速而又多功能的視覺化程式設計前端,以便瀏覽資料分析和視覺化,基繫結了 python以進行指令碼開發。它包含了完整的一系列的元件以進行資料預處理,並提供了資料帳目,過渡,建模,模式評估和勘探的功能。
專案主頁:
nltk(natural language toolkit)是python的自然語言處理工具包。2023年推出,至今發展非常活躍。它的主要作用是為了教學,至今已經在20多個國家60多所高校使用,裡面包括了大量的詞料庫,以及自然語言處理方面的演算法實現:分詞,詞根計算, 分類, 語義分析等。
專案主頁:
nupic是乙個開源的人工智慧平台。該專案由grok(原名 numenta)公司開發,其中包括了公司的演算法和軟體架構。 nupic 的運作接近於人腦,「當模式變化的時候,它會忘掉舊模式,記憶新模式」。如人腦一樣,cla 演算法能夠適應新的變化。( 詳情)
android十大開源專案
android開發又將帶來新一輪熱潮,很多開發者都投入到這個浪潮中去了,創造了許許多多相當優秀的應用。其中也有許許多多的開發者提供了應用開源專案,貢獻出他們的智慧型和創造力。學習開源 是掌握技術的乙個最佳方式。下面推薦幾個應用開源專案,這些專案不僅提供了優秀的創意,也可以直接掌握 android核心...
機器學習之十大機器學習演算法
邏輯回歸 機器學習實戰書籍和 分享 pca簡介 機器學習演算法篇 從為什麼梯度方向是函式變化率最快方向詳談梯度下降演算法 資源 有沒有必要把機器學習演算法自己實現一遍?推薦 用python實現 pattern recognition and machine learning 裡的演算法 推薦 斯坦福...
機器學習十大常用演算法
根據一些 feature 進行分類,每個節點提乙個問題,通過判斷,將資料分為兩類,再繼續提問。這些問題是根據已有資料學習出來的,再投入新資料的時候,就可以根據這棵樹上的問題,將資料劃分到合適的葉子上。在源資料中隨機選取資料,組成幾個子集源資料,這幾個子集得到幾個決策樹,將新資料投入到這 m 個樹中,...