機器學習庫

2021-08-01 14:51:23 字數 948 閱讀 7540

一、前提

在pthon下做機器學習,

需要科學計算包和繪相簿的支援,科學計算則是numpy或scipy,似乎numpy更流行些。畫圖工具包則必定為matplotlib。這些

都是開源、免費使用的,選擇這些庫主要的原因是做線性代數中的矩陣計算極為便利,而且效率比自己開發高的多

。二、機器學習庫

(1)scikit-learn

[python下做機器學習,

首推scikit-learn。該專案文件齊全、講解

清晰,功能齊備,使用方便,而且社群活躍。

機器學習是其的功能之一,主要還是側重資料探勘,可以用視覺化語言或python進行操作,擁有機器學習元件,還具有生物資訊學以及文字挖掘的外掛程式。

shogun,非日本的老外弄的乙個機器學習庫,還專門配了

乙個我們能看懂的日文名「將軍」(是日本幕府時代的將軍)。文件齊全,開發活躍,更新快,運算速度也很快。主攻大尺度的核函式,尤其是大尺度核函式下的svm。具有很多svm的高階用法,比如多核配用等。支援python、r、c++、matlab等語言。

(4)其它

a.pyml(a python module for machine learning,支援svm/knn/k-means==)

b.milk(python的機器學習工具包,主要是針對監督學習,包括svm/knn/決策樹)

本文參考了oschina.net及

matlab機器學習庫

knn fitcknn meas,species,numneighbors 5 cvmdl crossval knn kloss kfoldloss cvmdl predict knn,ones 1,size meas,2 latent 特徵值 從大到小 score特徵向量 coeff,score,...

sklearn 機器學習庫

pipeline parameters steps 步驟 列表 list 被連線的 名稱,變換 元組 實現擬合 變換 的列表,按照它們被連線的順序,最後乙個物件是估計器 estimator memory 記憶體引數,instance of sklearn.external.joblib.memory...

機器學習 numpy庫的學習

import numpy as np import random 處理數值型的資料 使用numpy生成陣列,型別為ndarray t1 np.array 1 2,3 print t1 print type t1 t2 np.array range 10 print t2 full填充元素 np.fu...