理工科生從大三往後,往往已經具備了學習機器學習和深度學習的基礎了,此時已經具備了高等數學、概率統計和線性代數的初步知識,本篇文章主要想描繪從此刻開始,到乙個合格的熟練掌握機器學習和深度學習知識的專業領域內的拔尖人才,這中間的路上需要踩過哪些地磚。都是一些個人的意見,僅供參考。
寫之前先端正乙個至關重要的觀念,只有基礎紮實的人,未來才可能成為乙個具備創造力的人。許多人受迷惑於當今的神經網路熱潮,在基礎尚未訓練牢靠時,致力於用奇思妙想改進網路,致力於閱讀*****尋找idea來碰巧變個新模型有個好效果來發*****,這些都是捨本求末。其實許多的新東西萬變不離其宗,極少極少能有好想法可以完全憑空出現而不依託於前人的思想,而有了想法也需要紮實的基礎才能實現和證明。例如,只需要熟練掌握概率統計的知識,就知道已經有了方差描述資料為什麼還需要有標準差,這其間的思想就足以產生batch normalization的idea;熟練掌握隱馬爾可夫鏈的相關知識,也具備了發現rnn神經網路的能力;詳細了解統計學習和數值分析的知識,就能通過基函式的知識得到神經網路的雛形以及如何優化。
明確了基本觀念之後,就是如何做了。總結一下大牛們的觀點就是以教材為主線,吃透教材中的基礎知識。
為什麼如此強調經典教材的學習呢?因為經典教材的內容往往代表了大牛們對知識點最本質的理解和梳理。最本質的理解和梳理有什麼好處?那就是可以舉一反三,用起來可以得心應手,只有這樣這個知識點才真正屬於自己。許多人熱衷於主要通過部落格的方式來學習東西,工程實操類的知識點還好,可是理論上的知識點如果不通過經典教材來學習就會埋下許多隱患。許多人會說:「可是我讀完部落格就確實理解了這個知識點了啊!」沒錯,大部分的用心的部落格看起來都能讓人有一種恍然大悟的感覺,可是許多時候產生這樣的感覺往往是假象,當你面臨另乙個場景的時候就會發現,為什麼還是束手無策還是一頭霧水呢?其實就是盲人摸象的道理,部落格的質量確實很好,但是如果把知識點比作象,有的部落格摸到了象腿,於是就在部落格中告訴你這是象腿,當然很令人恍然大悟,噢!這多簡單!可是下次遇到象頭呢?自然束手無策了。而大牛們在經典教材中會教你,如何識別乙個大象,學會這個的過程可能很困難,可是這才是把握本質應當付出的努力。
書本教材
除了上面的書籍之外,還有下面基本書籍有助本質理解,是不可多得的經典好教材
個人閱讀過的鞏固基礎,產生更深理解的書籍
理論和實踐相結合的書籍
人工智慧博士萬字長文分享——讀博那些事
初入nlp領域的一些小建議
初學者如何查閱nlp領域學術資料
nlp研究入門之道
那些高產的學者都是怎樣工作的
所謂「高產出」本身就不一定是人人希望追求的東西。而乙個人的方**嚴格來講只屬於他自己,別人難以複製 。但真正重要的大概是對自己如何管理時間、如何持續成長、如何完成個人目標的持續性思考。在此方面別人走過的路、做過的努力、展現的意志都有借鑑意義。
初學者如何查閱nlp領域學術資料
dblp計算機類文章檢索
有關如何寫作的書籍:strunk和white的《elements of style》對寫作中基本的應該如何不應該如何做了介紹。claire的《the mla』s line by line》(houghton mifflin)是有關在句子級別如何進行編輯的書籍。jacques barzun的《****** and direct: a rhetoric for writers》(harper and row, 1985)是有關如何作文的。
五個非常實用的機器學習資源
簡評 介紹了五個實用的機器學習資源,由淺入深,理論和實踐結合,資料是英文。python 機器學習 有中文版的書籍,另外園長在文末推薦了乙個實用的中文資源 對機器學習有興趣?出於許多充分的原因,許多高質量的機器學習教育資源往往對理論非常關注,尤其是在最開始打基礎的時候。但是,現在的風氣似乎變成了一開始...
收藏7個高階機器學習專案 附原始碼
1.使用機器學習進 感分析 專案構想 情感分析是分析使用者情感的過程。我們可以將他們的情緒分為正面,負面或中性。了解如何進 感分析是乙個很棒的專案,並且如今已被廣泛使用。這是最受歡迎的機器學習專案之一。其背後的原因是每家公司都試圖了解客戶的情緒,如果客戶滿意,他們會留下來。該專案可能顯示出減少客戶流...
資源 100頁機器學習入門完整版,初學者必備!
部分前言節選 讓我們從實話實說開始 機器其實不會學習。典型的 learning machine 所做的是找到乙個數學公式,當它應用於一組輸入 稱為 訓練資料 時,就會產生所需的輸出。這個數學公式還可以為大多數其他輸入 與訓練資料不同 生成正確的輸出,條件是這些輸入來自與訓練資料相同或類似的統計分布。...