2019.6.4 機器學習第一章,問題理解
假設空間:所有假設組成的空間。
從大類上劃分,瓜有好瓜的可能,瓜有壞瓜的可能和瓜無好壞之分,即無『好瓜』這種東西。
上圖中,西瓜訓練集,色澤,根蒂,敲聲,三個屬性中。
(1)色澤可有青綠、烏黑、淺白三種取值。
(2)根蒂可有蜷縮、硬挺、稍蜷三種取值。
(3)敲聲可有濁響、清脆、沉悶三種取值。
【上述的可能取值從書中參考的】
對於任意屬性,取任意值對於好壞無影響,我們用『*』通配來替代
則色澤可有4種取值,根蒂和敲聲同理。
總的假設空間為:4*4*4+1【『無好瓜』】 = 65種
從假設空間到版本空間的轉換
版本空間:從假設空間中搜尋並刪除與資料集中正例不一致的假設,與反例一致的假設,最終會獲得與好瓜結論一致的假設。
即得到反映好瓜的部分假設集合。
舉幾個假設空間的例子:
(1)色澤* 根蒂* 敲聲*
(2)色澤* 根蒂蜷縮 敲聲清脆
(3)色澤* 根蒂硬挺 敲聲沉悶
(4)色澤青綠 根蒂* 敲聲濁響
(65)φ
從訓練集中的第乙個例子
我們可以刪除掉給定的四個假設中的(2)(3)
因為給定的假設中,(2)的敲聲與資料集中的第乙個樣例的敲聲屬性值不符,(3)中的根蒂和敲聲都不符。
注意:*代表通配,可以用任意值替代,能夠滿足資料集中的樣例。
假設空間與概念空間(版本空間)
參考部落格 首先說明概念1 版本空間 version space 是概念學習中與已知資料集一致的所有假設 hypothesis 的子集集合。即是版本空間是假設空間中於樣本滿足一致的 假設集合 是基於樣本決定的。gb 是最大泛化正假設邊界 maximally general positive hypo...
機器學習(假設空間與版本空間)
假設空間 所有屬性的可能取值所組成的集合,比如西瓜 色澤屬性可取 青綠,烏黑,淺白,根蒂屬性可取 蜷縮,稍蜷,硬挺,敲聲屬性可取 濁響,清脆,沉悶,以及好瓜假設不存在。即西瓜問題的假設空間大小為 4 4 4 1 65 版本空間 根據已獲取的資訊 資料集 對假設空間進行剪枝,即找到乙個與資料集匹配的假...
西瓜書 假設空間與版本空間。如何求版本空間
假設空間 屬性所有可能取值組成的可能的樣本 版本空間 與已知資料集一致的所有假設的子集集合。在西瓜問題中,如何根據訓練集求所對應的版本空間?寫出假設空間 先列出所有可能的樣本點 即特徵向量 即每個屬性都取到所有的屬性值 對應著給出的已知資料集,將與正樣本不一致的 要與資料集中所有的正樣本一致,假設有...