機器學習演算法簡介

2021-09-12 21:58:36 字數 801 閱讀 3416

一、監督學習       

偏差和方差就像飛鏢射到靶子上。每個飛鏢就是從不同資料集得出的**結果。高偏差、低誤差的模

型就是把飛鏢扔到了離靶心很遠的地方,但是都集中在乙個位置。而高偏差、高誤差的模型就是把飛

鏢扔到了靶子上,但是飛鏢離靶心也很遠,而且彼此間很分散。低偏差、高誤差的模型就是把飛鏢扔

到了離靶心很近的地方,但是聚類效果不好。最後就是低偏差、低誤差的模型,把飛鏢扔到了離靶心

很近的地方,聚類效果也很好

在理想情況下,模型具有低偏差和低誤差,但是二者具有背反特徵,即要降低乙個指標的時候,另一

個指標就會增加。這就是著名的偏差-方差均衡(bias-variance trade-off)。

二、無監督學習

沒有誤差項要評估,其效果的是評估資料結構的一些屬性

機器學習系統應該可以這樣評估:用系統在真實世界中發生錯誤的代價來表示效果評估方法。

真陽性 真陰性 假陽性 假陰性四個結果可以用來計算分類系統效果的評價體系,包括準確率(accuracy),精確率(precision)和召回率(recall)三項指標

tp是真陽性統計結果,tn是真陰性統計結果,fp是假陽性統計結果,fn是假陰性統計結果:

準確率:

acc =tp + tn/(tp + tn + fp + fn)

精確率:

p =tp/(tp + fp)

召回率:

r =tp/(tp + fn)

機器學習 Random Forest演算法簡介

random forest是加州大學伯克利分校的breiman leo和adele cutler於2001年發表的 中提到的新的機器學習演算法,可以用來做分類,聚類,回歸,和生存分析,這裡只簡單介紹該演算法在分類上的應用。random forest 隨機森林 演算法是通過訓練多個決策樹,生成模型,然...

機器學習演算法與技術簡介

模型比較 lasso 對比機器學習技術參考 簡介 假設集是輸入空間上的超平面,目標函式是01error。演算法是每次更正錯誤直到沒有錯誤發生。h x s ign wtx wt 1 wt ynx n 優點 缺點 實踐建議 簡介 多層感知器 優點 缺點 實踐建議 簡介 假設集是特徵的線性組合,目標函式是...

機器學習部分演算法簡介

本篇所提到的優化演算法均為啟發式的優化演算法,這類優化演算法並不依賴於具體問題本身。因此,對絕大多數場景都可 即插即用 也正是因為這一點,這類演算法在很多情況下都不是最優的演算法。即對於具體問題而言,可能存在著其他更加高效率的演算法。比如對於凸優化問題來說,最速下降法 牛頓法 共軛梯度法等經典的非線...