機器學習演算法

2021-09-30 12:49:56 字數 956 閱讀 2300

監督學習的線性回歸演算法

採取測量不同特徵之間的距離方法進行分類

計算未知的資料a與所有已知樣本s(n)的距離,

按照距離遞增排序,找到k個距離a最近的樣本s1(k),

按照s1(k)的型別來判斷a的型別

監督分類演算法

1. 劃分資料集()

2. 遞迴構建決策樹

3. 使用決策樹進行分類

例如:根據水生和陸生初步判斷是否是魚類。

區域性加權線性回歸

使用條件概率進行分類

例如有兩個類別a,b以及資料c,如果c屬於a的概率大於c屬於b的概率,則將c歸為a類

訓練非線性函式用於分類

把測試集上每個特徵向量乘以最優化方法得來的回歸係數,再將該成績結果求和,最後輸入sigmoid函式,如果對應的值大於0.5就**類別標籤為1,否則為0.

利用核函式將資料對映到高維空間,尋找最有超平面

無監督聚類演算法

先隨機選取k個物件作為初始的聚類中心。然後計算每個物件與各個種子聚類中心之間的距離,把每個物件分配給距離它最近的聚類中心。聚類中心以及分配給它們的物件就代表乙個聚類。一旦全部物件都被分配了,每個聚類的聚類中心會根據聚類中現有的物件被重新計算。這個過程將不斷重複直到滿足某個終止條件。終止條件可以是以下任何乙個:

1)沒有(或最小數目)物件被重新分配給不同的聚類。

2)沒有(或最小數目)聚類中心再發生變化。

3)誤差平方和區域性最小。

尋找資料間的頻繁項集

例如:發現毒蘑菇的相似特徵,根據相似特徵判斷另一蘑菇是否有毒。

高效發現資料的頻繁項集

網頁排名

乙個頁面的「得票數」由所有鏈向它的頁面的重要性來決定,到乙個頁面的超連結相當於對該頁投一票。乙個頁面的pagerank是由所有鏈向它的頁面(「鏈入頁面」)的重要性經過遞迴演算法得到的。乙個有較多鏈入的頁面會有較高的等級,相反如果乙個頁面沒有任何鏈入頁面,那麼它沒有等級。

機器學習演算法

from 這裡,主要說一下,機器學習演算法的思想和應用!為了以後的應用總結一下!參考王斌譯的機器學習實戰一書。1 svd 奇異值分解 svd可以簡化資料,去除雜訊!對於簡化資料,使用svd,可以用小得多的資料集表示原有資料集。這樣實際上是去除了雜訊和冗餘資訊。比如有乙個32 32的影象,通過svd的...

機器學習演算法

1.c4.5演算法。c4.5 演算法與id3 演算法一樣,都是數學分類演算法,c4.5 演算法是id3 演算法的乙個改進。id3演算法採用資訊增益進行決策判斷,而 c4.5 採用的是增益率。2.cart演算法。cart 演算法的全稱是分類回歸樹演算法,他是乙個二元分類,採用的是類似於熵的基尼指數作為...

機器學習演算法

最近在學習機器學習。看的是 機器學習實戰 先簡單記錄一下,其實看似高階的理論或演算法,有些在我們平時生活中也有應用,比如機器學習中常用的k 近鄰演算法 knn 最大期望值演算法等 在機器學習中常用的演算法包括 決策樹,k 均值 k mean 支援向量機 svn k 近鄰演算法 knn 最大期望值演算...