譯 機器學習入門的正確方式

2021-08-07 23:37:52 字數 2064 閱讀 3154

譯者:邊星馳的部落格

初學者最常犯的5類錯誤以及怎樣去避免。本文翻譯自jason brownlee的how beginners get it wrong in machine learning。

正文始:

我幫助機器學習初學者開始他們的入門學習。但是我看到在學習的心態和實踐上,同樣的錯誤,大家犯了一遍又一遍。在這篇文章中,你將會了解到我所看到的初學者入門時常犯的5類錯誤。我堅信,每個人都可以進入並且在機器學習的領域做出一番事來。如果你現在停滯不前,轉折就在這裡,看看你犯了下面提到的哪些錯誤,糾正它,跳出坑來,進入對的學習狀態。我們開始吧!

傳統的機器學習教學方式是自底向上的。

埋頭苦學數學的背景知識

埋頭苦學機器學習的相關理論

埋頭苦學怎樣從無到有實現演算法

為的是最後開始使用機器學習(你的目標!)

這個方式很慢,而且艱難。這更多的是為想在這個領域墾出新東西的,做學術研究的人設計的。這不是從業者的學習路線,我們要的是產出,是結果。

如果你身在此坑,你會這樣想或這樣說:

苦學四年數學或者高深的演算法理論就能達成你想達成的?—— 你可能會放棄,會失敗。根本不能達成你的目標。解決方法就是翻轉這個模式的學習。

如果機器學習在商業上發揮最大價值的是做出準確的**,那麼就從怎樣建立問題模型並做出準確**入手。然後,在這方面做到足夠好。讀、竊、套用理論,只在你需要的時候,只在它能夠使你更好地創造價值的時候。

機器學習是個巨大的學習領域。它是用計算機實現學習過程的自動化並且與人工智慧(ai)有著很多重疊的部分。從高深的理論到機械人學,機器學習的領域是巨大的。想學遍這麼多的知識有些不現實。

選擇乙個小方面並且專注於它。然後繼續縮小學習範圍。

機器學習最有價值的領域就是**模型。通過建立資料模型然後做出**。就從這個開始。接著,專注於幾種與你最相關或最能引起你興趣的**模型。然後堅持下去。

也許你是根據技術手段選擇,比如深度學習;又或者你是根據問題的型別選擇,比如推薦系統。或許你還在猶豫,隨便選乙個吧。然後去做好或者說變得精通。

最後,開始另外乙個領域的學習迴圈。

機器學習的核心就是演算法。但是這裡演算法眾多,而且每乙個演算法都是乙個複雜的系統,有著自己的小的研究領域,自己的生態。你可能會迷失在乙個演算法中,有些人同你一樣。這些人叫學者。

如果你發現你在說這些話,你已身在坑中:

演算法不是最終的結果,而只是達成結果的手段。

事實上,機器學習的演算法是個「日用品」。更換它們,在你的問題中嘗試大量的演算法實現。除錯其中的一些,但是保持前進。你可以去深究怎樣用演算法得到更好的結果,但是要知道在適當的時候停下來。使用系統化過程。設計乙個除錯的實驗並且使其執行和分析自動化。機器學習就是關於如何使用更好的演算法,但是應用機器學習不能僅僅是和演算法糾纏不清。

要把注意力集中在從每個專案中得出結果,這也是一組**或者乙個模型的價值。

你可以從從零開始實現演算法中學到很多。有些時候,你甚至要實現乙個技術,因為沒有合適的或現成的實現手段。但是,一般情況下,你不必這樣做而且也不應該這樣做。

你的實現或許不堪入目,出現下面的情況:

你已在坑內,如果:

停!

剛開始學習機器學習,要是每次想要用什麼就自己動手從頭去實現會是乙個非常緩慢的學習過程。如果你正在自己實現演算法,要對自己有個衡量,並且把這個過程和學習如何利用機器學習產生價值分開。

現在有很多很棒的機器學習開發工具。事實上,好的開發工具,以及可供使用的資料和更快的硬體正是現在機器學習發展興盛的原因。但是你可能會犯這樣的錯:對每個你偶然發現的新工具都試試。

坑五如果你發現你這樣了,你就在坑里了:

學習並使用新工具。但是要有戰略考慮。把新工具整合到你的機器學習系統化過程工作流中。如果你選擇了乙個大的主要平台並且堅持使用,在解決問題的時候你會變得很有效率,當然你至少得熟悉或者精通這個平台。

python

r 語言

當然在你所研究的領域也有許多其他的和更專業的工具。業餘愛好者和專業人員的區別是什麼?——堅持不懈

在此文中,你了解到了我所看到的機器學習初學者常犯的5類錯誤。

再來看一下:

機器學習 1 機器學習的入門

最近由於專案要求,從零開始自學機器學習,使用語言是python2.7。機器學習分類 監督學習,無監督學習,強化學習 監督學習 對事物未知表現的 包括分類問題和回歸問題。1 分類 指給乙個新的模式,根據訓練模型推斷它所對應的類別是多少,是一種定性輸出,也叫離散變數 2 回歸 指給乙個新的模式,根據訓練...

機器學習入門

研究生考試結束了,考研通知書也在幾天前到手了,是時候安心下來考慮一下未來研究生的生活和學習了,看現在機器學習特別的火,所以我就先跟風學習一下機器學習吧。由於剛開始學習,所以對一些專有名詞不是很熟悉,所以特別做了一下總結,因為剛剛入門,所以就先整理了這些。人工智慧 一 認知和感知 區別看待 目前是在感...

機器學習入門

1.常用演算法 決策樹 隨機森林演算法 邏輯回歸 svm 樸素貝葉斯 knn演算法 k means演算法 adaboost 演算法 神經網路 馬爾可夫 2.聚類和分類的區別 分類 比如有一堆資料,你已經事先對他們做好了分類。你想要的功能就是,假如來了一條測試資料,我想知道他是哪一類,這就是分類。聚類...