周志華《機器學習》筆記(一)緒論

2022-08-14 19:24:14 字數 923 閱讀 9696

第一章 緒論

1、資料集(data set):機器學習資料的集合;

2、示例/樣本(instance/sample):每條資料描述了乙個物件的資訊,該物件稱之為示例,一般用x表示;

3、屬性(attribute):資料描述的樣本在某些方面的性質;

4、樣本空間(sample space):樣本張成的空間,又稱「屬性空間」或者「輸入空間」;

5、假設(hypothesis):學得模型對應了資料集中某種潛在的規律;

6、真相/真實(ground-truth):資料集本身的潛在的規律。學習的過程是逼近真相的過程;

7、標記(label):有關示例結果的資訊,一般用y表示;

8、樣例(example):具有標記資訊的示例;

9、標記空間//輸出空間(label space):所有標記的集合構成的空間;

10、分類(classification):一種典型的學習任務,將資料集按一定規律分為若干類;(監督學習)

11、二分類(binary classification):將資料集分為兩類;

12、回歸(regression):一種典型的學習任務,**資料集對應的結果;(監督學習)

13、聚類(clustering):無監督學習的一種,將訓練集的資料分為若干組,每組稱為乙個『簇』,且每個組的情況事先並不知道。

14、泛化能力(generalization):學得模型適用於新樣本的能力;

15、期望:在概率與統計學中是指每次可能結果的概率乘以其結果的總和,反映隨機變數平均值大小。

16、歸納偏好

奧卡姆刀(occam's razor):若有多個假設與觀察一致,則選擇最簡單的那個。

沒有免費午餐定理(no free lunch theorem  nfl):無論設計一種的演算法如何聰明,另一種演算法如何笨拙,他們的期望性相同。因此要談論演算法的相對優劣,必須要針對具體的學習問題。

《機器學習》周志華讀書筆記(一)緒論

什麼是機器學習?mitchell,1997 假設用p來評估電腦程式在某任務類t上的效能,若乙個程式通過利用經驗e在t中任務上獲得了效能改善,則我們就說關於t和p,該程式對e進行了學習。全文第1章緒論部分重點介紹了機器學習中的基本術語 假設空間 歸納偏好 發展歷程與現狀 基本術語 以一批西瓜為例 估計...

周志華機器學習筆記(一)

新人一枚,既是機器學習的初學者,也是首次發部落格。謹以此記錄我的學習體會,做一些總結。望與大家共同學習 共同進步。文中若有內容錯誤或有措詞不嚴謹之處,望大家不吝指出。謝謝!根據上圖我們可以用乙個三維空間來了解以下幾個基本術語。屬性與屬性值 屬性反映事件或物件在某方面的表現或性質的事項,在此圖表示為軸...

《機器學習》(周志華)學習筆記(一)

一 假設空間 科學推理的兩大手段 歸納 induction 和演繹 deduction 歸納 泛化過程,從具體的事實歸結出一般性規律 演繹 特化過程,從基礎原理推演出具體狀況 學習過程可以看作乙個在所在假設組成的空間中進行搜尋的過程,搜尋目標是找到與訓練集 匹配 fit 的假設,即可以將訓練集中的樣...