西瓜書第一章筆記

2022-07-12 00:21:11 字數 968 閱讀 8750

在這裡先列舉一些我先前不了解的基本術語:

根據一些樣例,來訓練我們的模型。如果**的是離散值,例如「好瓜」 「壞瓜」,這種學習任務我們稱為「分類」(classification);如果**的是連續值,例如西瓜的成熟度0.95、0.37,這類任務稱為「回歸」(regression)。

泛化能力(generalization):學得的模型適用於新樣本的能力。

西瓜書第五頁:空間規模的大小為什麼是\(4*4*4+1=65\)?

1.先整體考慮,色澤有4個屬性(\(*\)+淺白+青綠+烏黑),同理根蒂和敲聲也有4個(\(*\)在書中表示萬用字元,比如色澤=\(*\) 表示色澤可以取值任何顏色而不影響最終結果「好瓜」)。

因此3個屬性有四個屬性值可以任意選擇,\(4*4*4=64\),此外,考慮極端情況,如果「好瓜」這個概念本身不成立,世界上沒有「好瓜這種東西」,也就是說瓜都不存在了,

(色澤=\(\emptyset\))\(\wedge\)(根蒂=\(\emptyset\))\(\wedge\)(敲聲=\(\emptyset\)),那麼這也算一種情況。也許你又有新的疑問,能不能其中乙個或兩個屬性為空值呢?這是瓜,實實在在的瓜,你能想象乙個瓜有敲聲,而沒有色澤和根蒂的情況嗎?最後64+1=65。

2.分開考慮,這裡不使用萬用字元\(*\)。有3個屬性,每個屬性有3個值。

如果乙個屬性就能判定結果是否「好瓜」,則3個屬性中選乙個,屬性值有3種,即\(c_3^1*3 = 9\)。

同理,兩個屬性,\(c_3^2*3*3 = 27\)。三個屬性,\(c_3^3*3*3*3 = 27\)。此時27+27+9=63.還有兩種情況,一種是無論屬性的屬性值取什麼,都是好瓜,這對應於上個方法的各個屬性取萬用字元,另外一種是空集。63+2=65.

西瓜書\(\)~\(}}\)頁

沒有免費的午餐定理:

(暫時先更新到此,這個定理有待琢磨)

學習動力:2023年11月11日晚上因宿舍滅蚊而不得不和室友去教學樓學習。

(學習筆記)西瓜書 第一章

學習演算法 機器學習所研究的主要內容,是關於在計算機上從資料中產生 模型 的演算法,即 學習演算法 學習演算法的作用 屬性 特徵 反應事件或物件在某方面的表現或性質的事項 樣本空間 輸入空間 屬性張成的空間 n個特徵 n維空間 模型 從資料中學得的結果 學習器 學習演算法在給定資料和引數空間上的例項...

西瓜書第一章 緒論

人工智慧發展歷程 1 推理期 二十世紀五十年代到七十年代初。2 知識期 二十世紀七十年代中期,專家系統。3 學習期 二十世紀八十年代以來,被研究最多 應用最廣的是 從樣例中學習 一大主流是符號主義學習,代表包括決策樹和基於邏輯的學習 二十世紀九十年代中期之前,從樣例中學習 的另一主流技術是基於神經網...

西瓜書第一章的幾條總結

1 奧卡姆剃刀 occam s razor 是一種常用的 自然科學研究中最基本的原則。即 若有多個假設與觀察一致,則選擇最簡單的那個 2 天下沒有免費的午餐 定理 no free lunch theorem,簡稱 nfl 證明了所有演算法的期望效能都相同。但我們要注意到nfl定理有乙個重要的前提 所...