機器學習筆記(一)

2021-07-11 04:19:01 字數 3024 閱讀 9209

統計學習三要素:模型、策略和演算法。

模型分類有幾種,監督非監督,引數非引數等。監督學習又分為生成方法和判別方法。

生成模型有:樸素貝葉斯和隱馬爾科夫。

判別模型有:k近鄰,感知機,決策樹,邏輯回歸,em,svm,boost,crf.

引數模型

引數個數固定,與訓練資料無關。

非引數模型

引數個數依賴於訓練資料的個數,會變(不是沒有引數)。

舉例:最近鄰方法。每個點與資料之間的距離均為引數,與資料有關。

控制理論中,講求反饋。其實,這也是自然界中的重要的規律。人生好比海上的波浪,時起時落。社會上很多現象也這樣,物極必反。當我們要做出一些改進,決策的時候需要一些反饋,從而不斷的調整我們的決策。模型中有很多改進,需要一些反饋。可能是正反饋,也可能是負反饋。像梯度下降是一種負反饋,蟻群演算法資訊素的更新是一種正反饋。反饋一般是監督學習才有的,明顯只有知道結果的好壞才能給出應變,即代價函式(cost function)。下面說一下下面模型的評價標準。

1. 線性回歸

2. 邏輯回歸

3. 決策樹(id3,c45)

4. 神經網路

5. svm

6. 貝葉斯分類器

7. bagging與隨機森林

8. 聚類

公式如下:y(

x,w)

=w0+

w1x1

+...

+wdx

d 或者寫成向量相乘:y(

x,w)

=wtx

(x 是乙個向量)

最小化平方和誤差函式:e(

w)=

12∑n

n=12

擴充套件:y(x

,w)=

wtx 中的

x 為ϕj

(x)=

xj基函式是x的冪指數形式,則為多項式擬合。

順便說一句:用多項式擬合資料,最小化平方和誤差函式可以看成高斯雜訊模型假設下的最大似然解。

還有其他基函式如高斯基函式(rbf):ϕj

(x)=

exp 還有sigmoid基函式。在svm中也常用這些核函式,此外還有拉普拉斯核等。

正則化

常用l1,l2正則化。

min e(

w)=

12∑n

n=12

上面又稱為 經驗風險最小化。加上正則項之後(防止過擬合),又稱為結構風險最小化。

min e(

w)=

12∑n

n=12

+λj(

w)

l1與l2區別:

兩者都是限制w的大小。l2會限制w的大小,減少過擬合,但得不到稀疏效果,使w均趨於0。l1會產生乙個稀疏的模型,使一些w變為0。

l1:lasso回歸 j(

w)=∑

w|w|

l2:ridge回歸j(

w)=∑

ww2

稍微提一下,關於l1,l2的貝葉斯解釋。

其實正則項就是對w的先驗分布。而這些措施都是一些先驗知識。

lasso回歸——>laplace先驗分布+最大後驗估計(map)。

ridge回歸——>gaussian分布+map。

參考:正則項解釋hw

(x)=

g−1(

wtx+

b)

使用sigmoid 函式, z=

wtx+

b h

w(x)

=11+

exp(

−z)

將hw(x

) 看做後驗概率。p(

y=1|

x,w)

=hw(

x) p

(y=0

|x,w

)=1−

hw(x

) 這樣似然函式可以寫成p(

y|x,

w)=h

w(x)

y(1−

hw(x

))1−

y 極大似然函式l(

w)=p

(y|x

,w)=

∏ni=

1p(y

(i)|

x(i)

,w)

=∏nn=1h

w(x(

i))y

(i)(

1−hw

(x(i

)))1

−y(i

) 然後取似然函式的負對數(又稱交叉熵誤差函式)取最小值,即可。e(

w)=−

lnl(

w)=−

∑nn=

1y(i

)ln(

hw(x

(i))

)+(1

−y(i

))ln

(1−h

w(x(

i)))

id3演算法:

應用資訊增益準則選擇特徵。

c4.5應用資訊增益比來選擇特徵,是id3的改進。

資訊增益準則

資訊增益表示:得知特徵x資訊使y類資訊不確定性減少的程度。

資訊增益比

資訊增益比:資訊增益與訓練資料集關於特徵a的熵的比。相當於多除以乙個關於特徵的熵。以減小偏向於選擇取值較多的特徵。

決策樹的剪枝:防止過擬合,簡化模型。

cart演算法(分類與回歸樹)

對於分類樹用基尼指數(gini index)最小化準則,選擇特徵.

回歸樹用最小化平方誤差。

基尼指數,假設樣本k個類別,第k類概率為pk

。 gi

ni(p

)=1−

∑kk=

1p2k

prml

機器學習——周志華

統計學習方法——李航

機器學習筆記(一) 了解機器學習

1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...

機器學習筆記(一)

機器學習筆記 1,2課 一.線性回歸模型 1.數學模型 對於乙個具體的問題,x1,x2 是我們所選取的特徵,h x 是我們所建立的模型,其中有n 1個引數。我們希望所建立的數學模型可以很好的刻畫實際問題,而我們所擁有的就是訓練資料集。很自然的,我們希望數學模型可以較好的表述訓練資料集的情況。雖然對訓...

機器學習筆記(一)

總結自 機器學習 周志華 基本術語 資料 類似日常生活中的經驗,記錄關於乙個事件或物件的描述 屬性或特徵 反映事件或物件在某方面的表現或性質的事項,eg 顏色 根蒂 屬性值 屬性上的取值,eg 烏黑 青綠 屬性空間 樣本空間 輸入空間 屬性構成的空間,eg 用顏色 根蒂構成乙個關於西瓜的二維空間系,...