此系列為周志華老師的《機器學習》個人學習筆記。
1.1 基本概念
機器學習所研究的主要內容,是在計算機上從資料中產生「模型」(model)演算法,即學習演算法(learning algorithm)。有了學習演算法,我們把經驗資料提供給它,它就能基於這些資料產生模型;在面對新的情況時(例如看到乙個沒刨開的西瓜),模型會給我們提供相應的判斷(例如好瓜)。
1.2 基本術語
分類(classification): **的是離散值,例如「好瓜」、「壞瓜」
回歸(regression): **的是離散值,例如西瓜成熟度0.95,0.37
有監督學習(supervised learning):
訓練資料有標記資訊的學習任務為:監督學習,分類和回歸都是監督學習的範疇。
無監督學習(unsupervised learning):
訓練資料沒有標記資訊的學習任務為,常見的有聚類和關聯規則。
機器學習系列筆記 五
learning 拆分為兩個問題 一 我們如何可以讓ein g 和eout g 足夠接近?二 如何讓ein g 變的越來越小?m hyposesis的大小 m比較小的時候 good,p bad 2mexp bad 很少的選擇 m比較大的時候 好的選擇,壞事情發生的機率增加 把hypotheses 分...
機器學習系列筆記 八
雜訊與錯誤 noise and error 不同錯誤適用於不同的場景 false accpet 錯誤接受 false reject 錯誤拒絕 商場打折 fbi門禁 各種情況下有不同的權重 weighted classification weighted pocket algorithm 權重口袋演算...
機器學習系列筆記(一)
通俗來講,機器學習是一門致力於研究如何通過計算的手段,利用資料來改善系統自身的效能的學科。在進行機器學習之前,我們應該提前收集一批資料作為計算機的 經驗 這組資料的集合稱為資料集 其中每條記錄是關於乙個事件或者物件的描述,稱為示例 在事例中反映物件的某方面屬性稱為屬性或特徵 特徵的值稱為屬性值 所有...