關於機器學習的一些推薦

2021-10-24 08:12:07 字數 2157 閱讀 3700

課程工欲善其事,必先利其器。

想要學習「機器學習」,手裡沒點學習資料是不行的。這裡給出一些機器學習領域較為經典和著名的書籍和課程的推薦,看好書、聽好課,才能更好地進步。

西瓜書由南京大學周志華教授所寫,是機器學習領域一門非常著名的書籍。

這本書正式的書名是「機器學習」,是因為這本書的封面有很多西瓜,而且周老師在這本書中經常拿西瓜來舉例子幫助我們理解演算法,所以大家都親切地稱為「西瓜書」。

西瓜書是機器學習領域著名的入門書籍,書中的內容涵蓋是比較廣泛的,很多高校在授課時也都採用西瓜書及其配套的課件來進行教學。

但是西瓜書也有其自身的問題,只有幾百頁的篇幅,內容面廣泛就沒辦法詳細展開了,很多數學公式的推導一筆帶過,非常簡略。如果是自學的話對數學功底的要求較高,難度稍高。

這本書適合學校裡做教材有老師授課,或者機器學習中階讀者自學使用。如果是小白入門用這本書會有點困難。

前面我們提到了,西瓜書對於數學公式的推導是較為簡略的,如果數學功底不好學習起來是較為吃力的,實力勸退一波數學渣渣。

針對這種情況,開源組織datawhale在 2019 年開源了一本叫做「南瓜書」的電子書籍,對西瓜書中的絕大部分數學公式進行了推導並進行記錄。這本書也得到了周志華教授本人的認可和肯定

至於叫做「南瓜書」,則是因為這本可以作為西瓜書的參考資料,設計的時候想要和西瓜書組個cp,在封面畫了很多南瓜。

這本書和別的書不同,它是開源書籍,可以直接在網上瀏覽。這裡給出南瓜書的網頁:pumpkinbook

李航老師的統計學習方法也是機器學習領域一門非常經典的書籍,詳細描繪了統計學方法在機器學習領域的經典應用。

書中側重介紹了每種演算法的主要思想,以及如何使用。每章配有簡單的小例子,方便理解。

比起西瓜書,這本書顯得更加地容易理解,可以看出李航老師的功力非常深厚。同時,書中對於數學公式的推導更為詳細,方便看懂。書中重點針對監督學習和無監督學習兩塊的幾大演算法進行了介紹,覆蓋面沒有西瓜書的那麼廣。

清華大學深圳研究院的袁春教授為這本書的做了用於教學的ppt,可以適當地參看。傳送門密碼:1yrl

機器學習實戰這本書,也是機器學習領域一門非常著名的入門書籍,是公認的高質量書籍。

不像西瓜書只有大堆大堆的公式和理論,它最大的亮點就是對每乙個重要的演算法都有對應的**可供上機練習。畢竟,學習機器學習也是需要實踐的。

這門書會先對各種演算法進行簡單的介紹,並舉例子輔助理解,在輔之以上機實踐的**,**用 python 進行書寫。可以說是一本結合了理論與實踐的好書。

這本書是從外國翻譯過來的,出版時間是2023年。這就導致了乙個問題,這本書裡面的**是 python2.7版本的,而現在都2023年了,python早就用上 3.x版本了。

不過還好有人在 github 上對書中的**用 python3進行了重寫,可以進行參考 機器學習實戰github

吳恩達是當今機器學習領域的巨頭之一,可以稱為執牛耳者。

這門課講得非常好,深入淺出地帶你學習機器學習的相關基礎知識,而且課程裡對於高數、線代部分的涉及並不是很多,吳恩達老師很好地繞開了大部分數學推導,讓你能夠更輕鬆地進行學習

考慮到課程是純英文授課,對英語不好的同學就很不友好。國內搬運的時候對這門課程的字幕進行了翻譯,適當增加了課程的友好性。

與課程配套的有黃海廣博士的筆記 coursera-ml-andrewng-notes

老師會以精靈寶可夢作為例子來講解機器學習演算法,上課也比較有趣。對於想看中文講解的人來說絕對不可錯過,當然,繁體字還是很好認出來的。

datawhale 也對這門課程有配套的開源筆記 leeml-notes

關於機器學習的一些感悟

1 通過機器的學習 大規模 資料庫 複雜的感測器和巧妙的演算法,來完成分散的任務 是人工智慧的最新定義。2 mit 實驗室的機械人專家 rodney brooks 提出,要以 具身智慧型 embodied intelligence 的方法來製造機械人。從這種方法出發,製造類人機械人不再是發展更複雜的...

關於機器學習的一些概念

在連線主義學習中,把學習演算法分為三種型別,即非監督學習 unsupervised learning 監督學習 supervised leaning 和強化學習。強化學習 所謂強化學習就是智慧型系統從環境到行為對映的學習,以使獎勵訊號 強化訊號 函式值最大,強化學習不同於連線主義學習中的監督學習,主...

關於機器學習的一些感想

1.各種競賽啥問題?首先各種競賽是公司裡面沒有合理方案下的乙個產物,用盡可能少的成本來獲取最優方案.但是冠軍方案一定是最優方案嗎?顯然不是,因為各種比賽切斷了 人與人溝通 的因素,顯然對業務的理解程度更有利於你的建模,而所謂的資料比賽禁止了這種可能性.另外,特徵應該是資料建模人員來決定,而不是比賽舉...