第三章:機器學習的不同類別(三個角度):
1:二分類,多分類,回歸,struction learning(不常見)
2:監督學習,非監督學習,半監督學習(比如人臉識別中,不是每個樣本我們都能知道其類別,)增強學習(訓狗,深藍計算機的智慧型下棋)
3:batch learning,online learning (我們的資料是一筆一筆的來的,我們的g也是不斷變化的,如pla,和reinforcement learning),active learning (以前都是機器被動的接受資料,現在是讓機器自己問問題,當我們的label很難拿到時候使用)
第四章:機器學習的可能性
1.並不是所有的資料機器都可以學習,有的資料機器就無法從中學到東西
2.從概率的角度去闡述機器學習,我們做的事情其實就是概率中的用樣本來估計總體,但我們的樣本能否準確的估計總體?就是我們機器學習的內容,這裡我們引入了乙個數學公式:hoeffding』s inequality:p[
|v−u
|>ε]
≤2ex
p(−2
ε2n)
,這個公式中v就是我們的samples,u就是我們的資料總體,
ε 相當於是錯誤率,n是我們sampes的個數。
3.學習的過程就是我們選擇乙個hypothesis 來模擬我們的g,使其越來越接近我們的目標函式f,這裡的f是我們的目標,而g就是我們最終要學習的結果,我們的目標是讓g
≈ p[
|e(i
n)−e
(out
)|>ε]
≤2ex
p(−2
ε2n)
,由此知道即使我們得到了小的e(
in) ,也並是就意味這學習的結束,其必須讓我們的e(
out)
也非常小才可以。
這裡的m是所有bad data的h,之後再談其作用。未完……
搬運 台灣大學機器學習課程 by 李巨集毅
最近看到乙個比較好的機器學習課程,大致聽了一遍。整體感覺機器學習領域還是比較難,雖然李巨集毅老師講得還是挺好的,沒有足夠基礎吸收起來還是有一定困難。即便是已經把過程講了一遍,也很難理解到那些理論是如何構建起來的。這個課程乙個好是講到了當前最熱的深度學習,建議按需選擇學習。其他資料可以到 課程主頁 i...
SegmentFault 助力台灣大學黑客馬拉松
黑客馬拉松,即一夥程式猿在一定時間內共同協作編碼,也就是一場以程式設計為操作方式的馬拉松比賽,在有限的時間內將初步想法實現成型並展示出來的活動。facebook 據說就是這樣在哈佛宿舍誕生出來的。這是乙個從無到有的過程,主辦方會提供飲食和用於團隊協作的平台,參賽團隊需帶上自己的創意和實現工具 通常是...
台灣大學林軒田機器學習基石筆記(一)
1.什麼是學習?對人類來說學習就是通過觀察 視覺 聽覺 嗅覺等 掌握某種技能。比如我們從到大認識世界的過程。對於機器學習,我們希望計算機能夠像人類一樣,通過在大量的資料中觀察,發現事物的規律,獲得某種分析與解決問題的能力。所要解決的問題存在一些規律或者模式,可以通過學習提高表現 exists som...