sklearn 是基於python的機器學習工具模組。裡面主要包含了6大模組:分類、回歸、聚類、降維、模型選擇、預處理。
根據sklearn 官方文件資料,下面將各個模組中常用的模型函式總結出來。
1. 回歸及分類(監督學習)
1.1 廣義線性模型 (fromsklearn import linear_model)
最小二乘法:擬合乙個線性模型, 使得資料集實際觀測資料和**資料(估計值)之間殘差平方和最小。
clf=linear_model.linearregression(), clf.fit(x,y)
嶺回歸:改良的最小二乘,解決共線問題。
clf=linear_model.ridge(alpha=0.5),clf.fit(x,y)
邏輯回歸:
clf=linear_model.logisticregression()
1.2 樸素貝葉斯
高斯模型: from sklearn.*****_bayes import gassiannb
gnb=gassiannb(),gnb.fit(data, target).predict(data)
多項式模型:multinomialnb
伯努利模型:會把輸入資料二元化bernoullinb
1.3 決策樹 from sklearn import tree
決策樹分類器:clf=tree.decisiontreeclassifier()
回歸分類器(y 值為float非int):
clf=tree. decisiontreeregressor()
1.4 支援向量機
from sklearn import svm
clf=svm.svc()
2. 聚類
k-means:
from sklearn.cluster import kmeans
kmeans= kmeans(n_clusters=2, random_state=0).fit(x)
3. 降維
pca:
from sklearn.decomposition import pca
pca = pca(n_components=2)
method:
fit(x[y])
get_covariance()
get_params([deep])
get_precision()
score(x[y])
4. 特徵選擇
樹特徵:
from sklearn.ensemble import extratreesclassifier
5 .資料預處理
from sklearn import preprocessing
標準化:preprocessing.scale(x)
規範化:preprocessing.normalize()
二值化: preprocessing.binarizer()
處理缺失值:fromsklearn.preprocessing import imputer
imp=imputer(missing_values='nan',strategy='mean',axis=0)
機器學習總結
1.常用的機器學習演算法包括 監督學習 半監督學習 無監督學習 增強學習 遺傳演算法 監督學習 就是人為的設定規則,告訴機械人該執行怎麼樣的行動。無監督學習就是不告訴機械人具體的實施辦法,只給定規則,讓機械人過程當中自己學習總結經驗 半監督學習就是結合少標籤的樣本和大量無標籤的樣本進行學習和分類 強...
機器學習總結
0機器學習概述 什麼是機器學習?機器學習的分類 兩種分類方式。機器學習的一般流程 模型訓練中的交叉驗證 將資料分為幾份,每份第一次訓練做訓練集,第二次做了測試集 機器學習的評價 混淆矩陣 auc roc 一 線性回歸 解析解的求解過程,要求自己推導 目標函式,過擬合,正則式 模型效果 mse rms...
機器學習總結
傳統的機器學習大致分為 線性回歸 邏輯回歸 決策樹支援向量機 神經網路 等深度學習以神經網路的回歸為基礎,之後會談到的大致有 卷積神經網路 遞迴神經網路 這段時間學習以來,很直觀的體會到,機器學習的本質就是再用計算力和合適的 演算法來 你想要 的東西,比如房價問題,分類問題等。假設你的算力足夠強大,...