西瓜書第1章習題

2022-01-31 22:25:14 字數 736 閱讀 7756

1.1 試給出相應的版本空間。

首先有乙個「假設空間」,現實問題中假設空間一般很大。然後有許多策略是可以對假設空間進行搜尋,搜尋過程中刪除與正例不一致的假設、和反例一致的假設。最後選出來的假設的集合,就叫做「版本空間」

1.2 若使用最多包含k個合取式的析合正規化來表達表1.1西瓜分類問題的假設空間,估算共有多少種可能的假設

至少看到色澤有2種取值、根蒂有3種取值、敲聲有3種取值。可能的假設(「假設空間」的規模大小):3*4*4+1=49。

1.3 若資料報含雜訊,則假設空間中有不存在與所有訓練樣本都一致的假設。在此情形下,試設計一種歸納偏好用於假設選擇。

有多個假設,從已有的訓練樣本,無法判定哪個假設更好,但是我們必須要產生乙個模型。就需要用到「歸納偏好」。更偏好「平滑」的曲線。

1.4* 不使用「分類錯誤率」而用新的效能度量來對分類器進行評估,試證明「沒有免費的午餐定理」仍成立。

1.5 試述機器學習能在網際網路搜尋的哪個環節起什麼作用。

用在搜尋結果推薦。利用已有的某個使用者的歷史資料(如曾經搜尋看過什麼結果、使用者裝置資訊等),猜測他可能對哪一條搜尋結果感興趣。感興趣度應該是一系列的值,最後按照值的高度逆序排列。

《機器學習》西瓜書習題 第 1 章

表 1.1 中若只包含編號為 1 和 4 的兩個樣例,試給出相應的版本空間.這應該不難理解吧,直接上 編號色澤 根蒂敲聲 好瓜 1 青綠蜷縮濁響是 4 烏黑稍蜷沉悶否 與使用單個合取式來進行假設表示相比,使用 析合正規化 將使得假設空間具有更強的表示能力.例如 好瓜 leftrightarrow b...

《機器學習》西瓜書習題 第 4 章

試證明對於不含衝突資料 即特徵向量完全相同但標記不同 的訓練集,必存在與訓練集一致 即訓練誤差為 0 的決策樹.既然每個標記不同的資料特徵向量都不同,只要樹的每一條 從根解點到乙個葉節點算一條 枝幹代表一種向量,這個決策樹就與訓練集一致.試析使用 最小訓練誤差 作為決策樹劃分選擇準則的缺陷.4.1 ...

《機器學習》西瓜書習題 第 3 章

試析在什麼情況下式 3.2 中不必考慮偏置項 b 書中有提到,可以把 x 和 b 吸收入向量形式 hat w b 此時就不用單獨考慮 b 了.其實還有很多情況不用,比如說使用了 mathrm 編碼,就可以不用考慮偏置項.更廣泛的情況是,如果偏置項 b 可以被 包含 在另外的一些離散特徵裡,那麼就不用...