最近在學習機器學習。。。(看的是《機器學習實戰》)
先簡單記錄一下,其實看似高階的理論或演算法,有些在我們平時生活中也有應用,比如機器學習中常用的k-近鄰演算法(knn),最大期望值演算法等;
在機器學習中常用的演算法包括:決策樹,k-均值(k-mean),支援向量機(svn),k-近鄰演算法(knn),最大期望值演算法,貝葉斯演算法(nb)和分類回歸樹。
就拿最簡單的k-近鄰演算法來說:
knn是通過測量不同特徵值之間的距離進行分類。它的的思路是:如果乙個樣本在特徵空間中的k個最相似(即特徵空間中最鄰近)的樣本中的大多數屬於某乙個類別,
則該樣本也屬於這個類別。k通常是不大於20的整數。knn演算法中,所選擇的鄰居都是已經正確分類的物件。該方法在定類決策上只依據最鄰近的乙個或者幾個樣本
的類別來決定待分樣本所屬的類別。
舉乙個簡單的例子,來電影來說,根據乙個電影鏡頭裡面的打架和接吻次數來判斷這個是愛情片還是動作片(書中的例子),首先我們有乙個樣本,根據人的主觀臆斷已經分好類了,也就是我們所說的訓練樣本。
然後輸入乙個新電影的特徵,然後就用乙個簡單的最小二乘法去和樣本中的每個電影特徵去求距離,將求得的距離從小到大排序,取前面k個值做判斷,如果偏向於
動作片則就是動作片,如果偏向於愛情片,則該新片就是愛情片,其實這個就是我們生活中參考分類。
比如將蘋果分類,分為一等品,二等品等,我們根據重量,顏色,大小來確定和估計,這個k-近鄰演算法分類是乙個道理,只是在我們的大腦中已經將一二等品訓練過
很多次了,所以可以直觀的分類出來了,其他演算法也類似,接下來有時間將學習其他演算法
寫此部落格的意圖主要在於自己去理解演算法,並做乙個簡單的筆記,對於**和演算法的原理並有介紹,可能別人參考有限,在此抱歉。。。
機器學習演算法
from 這裡,主要說一下,機器學習演算法的思想和應用!為了以後的應用總結一下!參考王斌譯的機器學習實戰一書。1 svd 奇異值分解 svd可以簡化資料,去除雜訊!對於簡化資料,使用svd,可以用小得多的資料集表示原有資料集。這樣實際上是去除了雜訊和冗餘資訊。比如有乙個32 32的影象,通過svd的...
機器學習演算法
1.c4.5演算法。c4.5 演算法與id3 演算法一樣,都是數學分類演算法,c4.5 演算法是id3 演算法的乙個改進。id3演算法採用資訊增益進行決策判斷,而 c4.5 採用的是增益率。2.cart演算法。cart 演算法的全稱是分類回歸樹演算法,他是乙個二元分類,採用的是類似於熵的基尼指數作為...
機器學習演算法
監督學習的線性回歸演算法 採取測量不同特徵之間的距離方法進行分類 計算未知的資料a與所有已知樣本s n 的距離,按照距離遞增排序,找到k個距離a最近的樣本s1 k 按照s1 k 的型別來判斷a的型別 監督分類演算法 1.劃分資料集 2.遞迴構建決策樹 3.使用決策樹進行分類 例如 根據水生和陸生初步...