假設空間:所有屬性的可能取值所組成的集合,
比如西瓜:色澤屬性可取(青綠,烏黑,淺白,*),根蒂屬性可取(蜷縮,稍蜷,硬挺,*),敲聲屬性可取(濁響,清脆,沉悶,*),以及好瓜假設不存在。即西瓜問題的假設空間大小為(4*4*4+1=65)。
版本空間:根據已獲取的資訊(資料集)對假設空間進行剪枝,即找到乙個與資料集匹配的假設空間子集。
子集:如果乙個集合a的任意乙個元素都是集合b的集合,那麼集合a稱為集合b的子集。
泛化:指根據某些偏好(出現頻率高),選擇版本空間裡的一種假設作為判斷。
刪除與正例不一致的假設和與反例一致的假設 != 刪除錯誤的假設:
表1.1為例。色澤青綠,根蒂蜷縮,敲聲濁響的瓜是好瓜,若它作為一種假設,則需要被剔除,因為若它成立,則色澤非青綠,根蒂非蜷縮,敲聲非濁響的瓜都為壞瓜,這就與編號2的例項矛盾了。(沒考慮到假設的排他性,然也有例外的情況)。再比如說,色澤=*,根蒂=*,敲聲=濁響的瓜是好瓜,如果我們做出這種假設,對於表中的4種訓練樣本,在這種假設下都能做出正確的判斷。對於色澤是烏黑,根蒂蜷縮,敲聲濁響的瓜,根據這種假設,我們也能做出是好瓜的判斷。同理色澤=*,根蒂=青綠,敲聲=*的瓜是好瓜這條假設也匹配,這樣,就能得出與表1.1訓練集相匹配的版本空間。
《機器學習》 關於假設空間與版本空間
第一章緒論就丟擲一堆概念,看到假設空間與樣本空間有點懵,查了一些資料才大概了解,記錄一下。我的理解是 針對某乙個問題,所有可能存在的情況的集合,比如說書上的西瓜問題,西瓜的特徵有三個,色澤 根蒂 敲聲,這三個特徵可以用來描述乙個西瓜,已知的特徵中色澤有兩種,根蒂有三種,敲聲有三種,根據排列組合是有1...
假設空間與概念空間(版本空間)
參考部落格 首先說明概念1 版本空間 version space 是概念學習中與已知資料集一致的所有假設 hypothesis 的子集集合。即是版本空間是假設空間中於樣本滿足一致的 假設集合 是基於樣本決定的。gb 是最大泛化正假設邊界 maximally general positive hypo...
假設空間與版本空間的理解
2019.6.4 機器學習第一章,問題理解 假設空間 所有假設組成的空間。從大類上劃分,瓜有好瓜的可能,瓜有壞瓜的可能和瓜無好壞之分,即無 好瓜 這種東西。上圖中,西瓜訓練集,色澤,根蒂,敲聲,三個屬性中。1 色澤可有青綠 烏黑 淺白三種取值。2 根蒂可有蜷縮 硬挺 稍蜷三種取值。3 敲聲可有濁響 ...