如何使用本書(寫在第十次印刷之際):[pdf]
本書2016 年1
月底出版
, 首印
5000
冊一周內竟告售罄
; 此後
8 個月重印9 次
, 累積
72000 冊;
先後登上亞馬遜、京東、當當網等的計算機類暢銷書榜首
. 出乎預料的銷量和受歡迎程度
, 意味著本書讀者已大大超出了預設的目標人群
, 這使作者隱隱產生了些許不安
, 感覺有必要說一說本書的立場
, 以及使用本書需注意的一些事項
. 因此
, 在第
10 次印刷之際草就本文.首先
, 讀者諸君務須注意
, 本書是一本教科書.
如本書「後記」所述
, 寫作本書的主因是作者要開設「機器學習」課
. 根據作者的從教經驗
, 若每堂課涉及頁碼過多
, 則不少同學由於選修多門功課
, 在課後或許難有興趣和精力認真鑽研閱讀
, 教師也會因「包袱太重」而失去個人發揮的空間
. 因此
, 作為一學期課程的教材
, 本書篇幅進行了仔細考量
: 16
章正文,
每章 6-7 節,
一般不超過
25 頁
. 研究生課程若每學期
18 周
, 則除去習題和答疑時間
, 基本上每週講授一章
; 本科生課程則可進度稍緩
, 一學期講授
9-10 章.
囿於此限
, 作者需對內容材料、以及材料講述的程度進行取捨
; 否則若不分鉅細,其篇幅可能令讀者望而生畏
. 因此
, 讀者不要指望本書是無所不包、「從入門到精通」的書籍
. 事實上
, 對機器學習這個發展極迅速、已變得非常廣袤的學科領域
, 那樣的書尚不存在
; 即便出現
, 也非數千頁不止
, 不適於用作教科書.
第二,
這是一本入門級教科書.
作者以為
, 入門階段最需要的是理清基本概念、了解領域概貌
. 這好比人們到了乙個陌生的地方
, 首先要去找張地圖
, 大致弄清**是山、**有水、自己身在何處
, 然後才好到具體區域去探索
.讀者當然都希望所學「既廣且深」
, 但在有限時間內必先有個折中
. 在入門階段
, 「顧及細微」應該讓位於「觀其大略」
, 否則難免只見樹木、不見森林
. 因此
, 作者試圖通過化繁為簡的講述
, 使讀者能在有限的篇幅中感受更多的、應該接觸到的內容
. 一定程度上說
, 本書的主要目的就是為讀者提供一張「初級地形圖」、給初學者「指路」
, 而本書提供的這張「地形圖」
, 其覆蓋面與同類英文書籍相較不遑多讓.
機器學習中存在多種學派可從其角度闡釋其他學派的內容
. 作者以為
, 理解學派間的包容等價
, 在高階之後對融匯貫通大有裨益
, 但在入門階段
, 先看到各自的本原面貌更為重要
. 因為沒有任何乙個學派能完全「碾壓」其他
, 而過早先入為主地強化某學派觀念
, 對理解欣賞其他學派的妙處會埋下隱礙
. 因此,本書盡可能從材料的「原生態」出發講述
, 僅在少數地方簡略點出聯絡
. 需說明的是
, 作者試圖以相近深度講述主要內容
. 讀者若感到在某些地方「意猶未盡」
, 或因作者以為
, 入門階段到此程度已可
, 對其他內容的初窺優先於此處的進一步深究
. 另外
, 機器學習飛速發展
, 很多新進展在學界尚無公論之前
, 作者以為不適於寫入入門級教科書中; 但為了不致於與學科前沿脫節
, 本書也簡略談及一些本領域專家有初步共識的相對較新的內容.
第三,
這是一本面向理工科高年級本科生和研究生的教科書.
對前沿學科領域的學習
, 必然需有基礎知識作為先導
. 為便於盡可能多的讀者通過本書對機器學習有所了解
, 作者已試圖盡可能少地使用數學知識
, 很多材料盡可能選擇易於理解的方式講述
. 若讀者感覺書中涉及的數學較深
, 且自己僅需對機器學習做一般了解
, 則不妨略過細節僅做概觀
, 否則建議對相關基礎知識稍作複習以收全功
. 囿於篇幅
, 作者對許多材料盡可能述其精要、去其細冗
,所涉數學推導在緊要處給出闡釋
, 對理工科高年級同學稍下工夫就易自行弄清的繁冗則惜墨不贅.
讀者不要指望通過讀這本入門級教科書就能成為機器學習專家
, 但書中各章分別給出了一些文獻指引
, 有興趣的讀者不妨據此進一步深造
. 另外
, 網際網路時代之資訊獲取已相當便利
, 讀者可以容易地在網上找到機器學習中關於單個「知識點」的內容
, 而資訊搜尋是理工科學生必備的本領
, 只需知道自己在「找」什麼
, 就應該一定能找到材料
. 根據本書提供的「地形圖」
, 讀者若渴望對某個知識點進一步**
, 「按圖索驥」應無太大困難.
第四,
這本書不妨多讀幾遍.
初學機器學習易陷入乙個誤區
: 以為機器學習是若干種演算法(方法
)的堆積
, 熟練了「十大演算法」或「二十大演算法」一切即可迎刃而解
, 於是將目光僅聚焦在具體演算法推導和程式設計實現上
; 待到實踐發現效果不如人意
, 則又轉對機器學習發生懷疑
. 須知
, 書本上僅能展示有限的典型「套路」
,而現實世界任務千變萬化
, 以有限之套路應對無限之變化
, 焉有不敗!現實中更多時候
, 需依據任務特點對現有套路進行改造融通
. 演算法是「死」的
, 思想才是「活」的
. 欲行此道
, 則務須把握演算法背後的思想脈絡
, 無論創新科研還是應用實踐
, 皆以此為登堂入室之始
. 本書在有限篇幅中側重於斯
, 冀望輔助讀者奠造進一步精進的視野心法
. 讀者由本書初入門徑後
, 不妨擱書熟習「套路」
, 數月後再閱
, 於原不經意處或能有新得
. 此外
, 作者在一些角落融入了自己多年研究實踐的些微心得
, 雖僅只言片語
, 但可能不易得之
, 高階讀者閱之或可莞爾.
讀者若僅對某幾種具體機器學習技術的演算法推導或工程實現感興趣
, 則本書可能不太適合
; 若僅需機器學習演算法「速查手冊」
, 則直接檢視維基百科可能更便利一些.
作者自認才疏學淺
, 對機器學習僅略知皮毛
, 更兼時間和精力所限
, 書中錯謬之處甚多
, 雖每次印刷均對錯處或易誤解處做勘誤修訂
, 但仍在所難免
, 若蒙讀者諸君不吝告知
, 將不勝感激.
勘誤修訂
[部分修訂是為了更便於讀者理解,並非原文有誤]
(第一版第13次印刷, 2023年11月):
(第一版第12次印刷, 2023年11月)
(第一版第11次印刷, 2023年10月)
(第一版第10次印刷, 2023年9月):
(第一版第9次印刷, 2023年8月)
(第一版第8次印刷, 2023年5月):
(第一版第7次印刷, 2023年4月):
(第一版第6次印刷, 2023年4月):
(第一版第5次印刷, 2023年3月):
(第一版第4次印刷, 2023年3月):
(第一版第3次印刷, 2023年3月):
(第一版第2次印刷, 2023年2月):
(第一版第1次印刷, 2023年1月):
機器學習中的數學修煉(含勘誤表!)
數學是機器學習和資料科學的基礎,任何期望涉足相關領域並切實領悟具體技術與方法的人都無法繞過數學這一關。本書系統地整理並介紹了機器學習中所涉及的必備數學基礎,這些都是筆者從浩如煙海的數學知識中精心萃取的,在學習和研究機器學習技術時所必須的內容。具體包括概率論與數理統計 微積分 主要是與最優化內容相關的...
《機器學習》 周志明2023年11月勘誤修訂
以下擷取至周志明老師的主頁,方便查閱 機器學習 這本教材的勘誤記錄 勘誤修訂 勘誤修訂 部分修訂是為了更便於讀者理解,並非原文有誤 第一版第13次印刷,2016年11月 第一版第12次印刷,2016年11月 第一版第11次印刷,2016年10月 第一版第10次印刷,2016年9月 第一版第9次印刷,...
Spring Cloud系列勘誤
spring cloud系列已經寫完了,這是一系列的學習筆記,由於寫作匆忙,難免會有出錯的文字或者 實在抱歉。目前作者已經發現了幾處有錯誤的地方,為了小夥伴們在學習的過程中不陷入泥淖,我將已發現的幾處錯誤先列出來,如果小夥伴還有發現其他錯誤,歡迎指正。1.使用spring cloud搭建高可用服務註...