最近在跟stanford大學放在coursera上的機器學習課程,講師是著名的華人andrew ng. 這是我見過為數不多的為期10個星期的課程,而且每個星期巨大的工作量也是罕見。
機器學習大致分為兩類:supervised learning和unsupervised learning,我自行翻譯一下是自發學習和非自發學習,雖然順序顛倒了一下。
一些課程中用到的符號表示,andrew意思是這些符號在普遍的機器學習使用中都有運用,所以這裡還是提及一下。notation
meaning
m樣本的數量x輸入
y輸出(x, y)
單次訓練(x
(i),
y(i)
) 第
i 個訓練集合
機器學習大概的模型是一組訓練集,經過了演算法的處理得到輸出,主要過程如下圖所示:
x(input) -> h-> y(output)
其中h是hypothesis 的意思,當 h=
θ0+θ
1x的時候我們成這種演算法為「線性回歸」(linear regression)。
下面介紹了cost function和gradient descent(梯度下降法)。
cost function:
j(θ0,θ1
)=12
m∑i=
1m(h
θ(x(
i))−
y(i)
)2而gradient descent就是一種最小化cost function的方法,找到使得cost最小的 θ0
,θ1 的值,或者說向量
θ 的值,課程給我乙個印象就是向量化非常重要。
具體執行gradient descend的時候步驟是這樣的:先從某個選定的 θ0
,θ1 開始,不斷改變他們倆的值從而減小cost,直到達到最小值。如何改變,課程裡運動了求偏導數,可能就是求梯度的方法:
θj:=
θj−α
∂∂θj
j(θ0
,θ1)
乙個正確的gradient descend過程應該在每次改變
θ 值後cost都能減小,越往後減小的量越小,最終收斂於某個值,這就是我們想要的最小值。
深度學習的學習歷程
我剛入門深度學習的時候,看了各種深度學習相關的資料,花書 cs231n neural networks and deep learning cs224d等等。看來看去,感覺好像什麼都懂了,不就那些模組嗎,conv lstm pooling fc drop out等等,這些模組的公式早就能背得滾瓜爛熟...
Ogre 學習的歷程
我的瑞士留學 生活之到達並感受著 我去瑞士留學 時飛機的故障,迫使飛機反航。我就這樣一直坐在窗邊看著飛機放油,40噸航空油,在空中足足放了1個多小時。最終,當所有的油放光後,飛機在機長的高超駕駛技術下,安全著陸了。著陸的一瞬間,全機乘客爆發出熱烈的掌聲,表示對機長的感謝。我的心也終於不再空白,也是由...
學習遞迴的歷程
鍵盤輸入1234,按順序列印出1 2 3 4 設定乙個函式print int n 1 先列印print 123 4 2 再列印print 12 3 4 3 再列印print 1 2 3 4 4 最後列印1 2 3 4 void print int n printf d n 10 intmain 編寫...