假設空間與版本空間的理解

2021-09-24 03:55:33 字數 861 閱讀 9503

2019.6.4 機器學習第一章,問題理解

假設空間:所有假設組成的空間。

從大類上劃分,瓜有好瓜的可能,瓜有壞瓜的可能和瓜無好壞之分,即無『好瓜』這種東西。

上圖中,西瓜訓練集,色澤,根蒂,敲聲,三個屬性中。

(1)色澤可有青綠、烏黑、淺白三種取值。

(2)根蒂可有蜷縮、硬挺、稍蜷三種取值。

(3)敲聲可有濁響、清脆、沉悶三種取值。

【上述的可能取值從書中參考的】

對於任意屬性,取任意值對於好壞無影響,我們用『*』通配來替代

則色澤可有4種取值,根蒂和敲聲同理。

總的假設空間為:4*4*4+1【『無好瓜』】 = 65種

從假設空間到版本空間的轉換

版本空間:從假設空間中搜尋並刪除與資料集中正例不一致的假設,與反例一致的假設,最終會獲得與好瓜結論一致的假設。

即得到反映好瓜的部分假設集合。

舉幾個假設空間的例子:

(1)色澤* 根蒂* 敲聲*

(2)色澤* 根蒂蜷縮 敲聲清脆

(3)色澤* 根蒂硬挺 敲聲沉悶

(4)色澤青綠 根蒂* 敲聲濁響

(65)φ

從訓練集中的第乙個例子

我們可以刪除掉給定的四個假設中的(2)(3)

因為給定的假設中,(2)的敲聲與資料集中的第乙個樣例的敲聲屬性值不符,(3)中的根蒂和敲聲都不符。

注意:*代表通配,可以用任意值替代,能夠滿足資料集中的樣例。

假設空間與概念空間(版本空間)

參考部落格 首先說明概念1 版本空間 version space 是概念學習中與已知資料集一致的所有假設 hypothesis 的子集集合。即是版本空間是假設空間中於樣本滿足一致的 假設集合 是基於樣本決定的。gb 是最大泛化正假設邊界 maximally general positive hypo...

機器學習(假設空間與版本空間)

假設空間 所有屬性的可能取值所組成的集合,比如西瓜 色澤屬性可取 青綠,烏黑,淺白,根蒂屬性可取 蜷縮,稍蜷,硬挺,敲聲屬性可取 濁響,清脆,沉悶,以及好瓜假設不存在。即西瓜問題的假設空間大小為 4 4 4 1 65 版本空間 根據已獲取的資訊 資料集 對假設空間進行剪枝,即找到乙個與資料集匹配的假...

西瓜書 假設空間與版本空間。如何求版本空間

假設空間 屬性所有可能取值組成的可能的樣本 版本空間 與已知資料集一致的所有假設的子集集合。在西瓜問題中,如何根據訓練集求所對應的版本空間?寫出假設空間 先列出所有可能的樣本點 即特徵向量 即每個屬性都取到所有的屬性值 對應著給出的已知資料集,將與正樣本不一致的 要與資料集中所有的正樣本一致,假設有...