西瓜書的鼎鼎大名早有耳聞,於是毫無疑問買來入門。
寫此文章的時候剛要做完第二章的練習題。
在看的時候有一些感慨:
需要一定的數理基礎,尤其是概率論的內容。但是如果沒學過也不建議直接去啃概率論,只要把相關的部分看看即可。
周老師預設我們能力很強,所以有些地方說得不夠詳細,僅靠此書無法理解,需要自己另行查閱。
有一些疑似謬誤的地方,但是我自己能力較差,又苦於沒有人佐證,所以並不敢說周老師一定錯了。
在看的過程中,記錄了一些自己的疑問。有些解決了,有些沒解決,也有一些沒有記錄下來。下面附上記錄下來的內容。
因為博主也在學習過程中,所以問題會有更新。方式還沒想好,屆時再說。
p31 繪製p-r曲線的過程,語焉不詳,可參考p33 roc曲線繪製過程,但建議還是上網查。
p32 f1度量,p和r的究竟在哪一點取值,語焉不詳。有博主認為,f1的p和r是實際訓練結果的取值;若依此言,f1就不是學習器的效能量度,而是分類器的效能量度;因為顯然,在相同的學習器下,不同分類器將得到不同的p和r值。
p35 公式2.20,從書34頁b圖看來,auc的公式不應該寫的這麼複雜,後來才發現原來這個圖並沒有正例反例**值相等的情況。當出現這種情況時,roc曲線會呈斜線上公升,而不是這種只有水平和垂直兩種情況。
p36 式2.24,p的含義 「樣例為正例的概率」 語焉不詳,公式難懂。參考回答非常詳細經典。
p38 公式2.27,等號右側的є和є0 好像寫反了。
西瓜書 機器學習《一》
泛化能力 學習的模型適應新樣本的能力。奧卡姆剃刀原則 自然科學研究中常用的原則。即 若有多個假設和觀測一致,那麼就選擇最簡單的假設。連線主義 黑箱模型,例如 神經網路,不可解釋性,引數手工等調整 符號主義 決策理論的學習技術,例如決策樹學習 以資訊理論為基礎,以資訊熵的最小化為目標。統計學習 svm...
西瓜書機器學習筆記 一
記錄學習機器學習的過程,方便自己以後查閱 機器學習是一門致力研究如何通過計算的手段,利用經驗來改善系統自身的效能的學科 在計算機系統中,經驗通常以 資料 形式存在,因此,機器學習所研究的主要內容是關於在計算機上從資料中產生 模型 的演算法,即 學習演算法 learning algorithm 通過經...
西瓜書(《機器學習》周志華)習題解析 第1章 緒論
1.1 表1.1中若只包含編號為1和4的兩個樣例,試給出相應的版本空間 編號色澤 根蒂敲聲好瓜1 青綠蜷縮濁響是 2烏黑蜷縮濁響是3 青綠硬挺清脆否 4烏黑稍蜷沉悶 否在書中給出的西瓜資料集中,樣本有三個維度 色澤 根蒂 敲聲,其中色澤有兩個可能的取值 根蒂有三個 敲聲有三個 各自加上通配,再加上 ...