從西瓜的例子來看,色澤、根蒂、敲聲每種特徵均有三個屬性。
我們想要從所有可能性中抽取一條規則來定義什麼瓜是好瓜。而我們的假設空間則包含所有可能性。
這裡我們可以從兩個角度得到最終結果65。
一、分別考慮
現在我們一共有3個特徵,如果我們只需要從3個特徵中選取乙個特徵中作為最終的結果(這意味著剩餘兩個特徵無關緊要),我們一共有3*3=9種可能;
如果我們需要從3個特徵中選取2個特徵作為最終的結果,則一共有$c_^ * 3*3=27$種可能;
如果我們需要從3個特徵中選取3個特徵作為最終的結果,則一共有$3*3*3=27$種可能;
如果我們乙個特徵都不需要,恆真,則為一種可能;
如果我們發現什麼特徵都沒有用,恆假,則為另外一種可能;
綜上一共有65種可能。
二、 整體考慮
我們像周志華老師書中提到的一樣,引入萬用字元,作為這個特徵無關緊要的標誌。
因此$(*+3個屬性)(*+3個屬性)(*+3個屬性)+恆假=65$種可能;
以上便是兩種得到65的思路。
機器學習(周志華版)學習筆記(二)假設空間
科學推理的兩大手段 歸納 從特殊到一般的泛化過程。泛化 從樣本中學習訓練出不在樣本中的資料集的共同特徵 使其適用於整個樣本空間。演繹 從一般到特殊的特化過程。特化 與泛化相反 整體樣本的共同特徵推演出具體特徵。例子理解 編號色澤 根蒂敲聲好瓜1 青綠蜷縮濁響是 2烏黑蜷縮濁響是3 青綠硬挺清脆否 4...
《機器學習》 關於假設空間與版本空間
第一章緒論就丟擲一堆概念,看到假設空間與樣本空間有點懵,查了一些資料才大概了解,記錄一下。我的理解是 針對某乙個問題,所有可能存在的情況的集合,比如說書上的西瓜問題,西瓜的特徵有三個,色澤 根蒂 敲聲,這三個特徵可以用來描述乙個西瓜,已知的特徵中色澤有兩種,根蒂有三種,敲聲有三種,根據排列組合是有1...
周志華《機器學習》版本空間
版本空間定義 版本空間 version space 是概念學習中與已知資料集一致的所有假設 hypothesis 的子集集合。對於二維空間中的 矩形 假設 上圖 綠色加號代表正類樣本,紅色小圈代表負類樣本。gb 是最大泛化正假設邊界 maximally general positive hypoth...