目前,工作中的事情相對少一點,富餘時間比較足,因此,可以拿出一部分時間用來學習下機器學習方面的理論知識與實踐知識。這樣做主要出於兩個方面的目的,一方面是想通過本次整理的系列來增強與梳理自己在機器學習領域中的理解,梳理出自己在機器學習領域中的方**,另一方面,提公升自己的實際工作效率。
好了,以上說明了本次系列的背景,接下來將主要闡述本系列的主要內容:
* 希望能夠以自己的理解闡述什麼是機器學習,機器學習的框架,機器學習可以用來解決什麼樣的問題等等
* 闡述機器學習中常用的優化方法
* 從模型的角度出發,深入闡述不同模型,主要從以下幾個方面來闡述模型:a. 模型是什麼(這種闡述是一種通用型的表述);b.模型產生的背景與原因(通常是為了解決另乙個模型中的缺點,而產生的一種新的模型);c.模型的應用場景限制或者說是前提條件以及常見的應用場景;d.模型涉及的梳理理論背景知識;e.闡述模型的理論推導
* 最後,盡可能地能夠輸出乙份相對完整的模型間的整合對比
以上就是本系列希望能夠實現的乙個目標,希望接下來會有系列2,系列3…,接下來將正式進入本系列的內容當中。
"機器學習"顧名思義,就是讓機器來學習,如果將機器和人進行模擬的話,可以認為機器的學習過程和人的學習過程在一定程度上是具有相似性的。通常,人在學習的過程中,都需要確定以下資訊:1、學習什麼領域的知識?2、學習的內容或者目標是什麼?3、通過什麼學習方法來進行學習,使得自己能夠快速掌握這些知識點?4、同時,還有乙個重要的點,就是我們應該將習得的知識應用於我們的日常生活中,通過知識來豐富與提公升個人的生活品質嘛。
同理,機器學習也會遇到人在學習過程中所遇到的問題,比如:1、機器學習也是學習特定領域中的知識或者規律的,這裡的特定領域通常就是指我們在實際的工作中所遇到的業務問題,而這個」業務問題「就是機器學習中所涉及到的知識背景;2、那麼機器需要學習什麼呢?這個學習的內容通常需要我們人類參與設計,為什麼呢,當下機器學習終究還是為了我們人類而服務的,因此,為了讓機器能夠更好地服務於人類,那麼我們自己就要扮演者"出題者"的決策,即你告訴機器學習什麼內容,這個過程實際上就是建模的過程,通常這也是在我們實際的工作生活中最重要的一部;3、當人類給了機器設定了學習目標(通常這個目標是能夠用數學等相對抽象的方式進行表達)後,機器就需要能夠通過自己的方**來學習以及人類所提供的材料(資料)來掌握目標中的知識點,通常機器用來進行學習的方**被稱為優化演算法,但是在這個學習過程中,我們怎麼來判斷它知識點掌握得牢靠呢,同時我們還需要判斷它到底有沒有提公升的空間呢,最可靠的方式就是制定標準化考試的評分機制(損失函式),來計算在該評分機制下的得分,從而判斷機器對知識點掌握的程度如何,如果達到令人滿意的程度,那麼我們就可以給機器放假啦,但是,如果沒有達到令人滿意的程度,我們就需要想方設法地讓機器優化其習得的結果(通常有以下做法:一、給機器提供更多的材料及資料;二、讓機器不斷地投入精力(不斷迭代優化);三、也許這個機器偏科,那麼我們可以重新制定學習目標;四、既然乙個人考試的結果不好,那麼我們讓大家一起協同起來,各自發揮自己的長處);4、最好,當機器很好地掌握了知識點後,我們就可以放心地讓其來提公升我們的業務啦。
以上通過相對形象的方式闡述了機器學習的過程到底是乙個什麼樣的情況,具體的如下圖:
機器學習的應用面非常廣,但凡是所有能夠通過數學模型抽象出來的問題,理論上都是能夠應用機器學習的,目前,主流的應用有:推薦系統,廣告ta,金融風控等。在不同的應用環境中,會有不同的業務問題,因此,通常會出現不同的模型,當然有些模型也是能夠跨行業,跨問題的,在實際過程中,還是需要具體問題具體分析,設計出最佳的業務數學模型。
目前常見的模型有:線性回歸模型,logistics回歸模型,em模型,樸素貝葉斯模型,決策樹,boosting模型,bagging模型,knn模型,svm模型,神經網路模型,hmm模型,時間序列模型、等等,每經典的模型都值得我們花時間去深入分析與理解,本系列的後續文章中將逐一來闡述這些模型。
在數學史上,數學大師們已經提出很多的優化演算法來解決數學中的優化問題,經典有:最小二乘法、梯度下降法(隨機梯度下降法、mini-batch隨機梯度下降法)、最大似然估計法、牛頓法、擬牛頓法等,除此之外,還有一些在計算機領域中常用的優化演算法,例如:smo演算法(後續補充…)等。在接下來的文章中,我們也將逐一來理解這些優化演算法
在上文也提到過,建模的過程通常是需要我們人來參與設計的,那麼在遇到乙個實際的業務問題的時候,我們應該如何建模呢?
(後續補充…)
好了,本文作為這個系列的第一篇,有點匆忙,後續將逐步來深入理解機器學習中的重要的知識點。
晚安,2018.3.15~
機器學習概論
假如現在有n個房子的面積大小與 我們想通過這些資料得出乙個模型,這個模型的作用是,當我輸入這n個房子之外的其它房子的面積時,模型可以 出它們的 很好,這就是高中學過的線性回歸!機器學習按學習方式可分為 監督學習 無監督學習 強化學習 按演算法可分為 傳統機器學習 深度學習 強化學習 監督學習的任務是...
機器學習 機器學習概論
3 模型評估與模型選擇 4.具體應用 統計學習 是關於計算機基於 資料 構建概率統計模型並運用模型對資料進行 分析 統計學習的三要素 模型在監督學習中,模型就是所要學習的條件概率分布或決策函式。這在後面的章節中會重點介紹。策略 評價模型的標準 用損失函式和代價函式來度量 錯誤的程度。1 幾種損失函式...
機器學習小概論
機器學習發展歷程 人類一直試圖讓機器具有智慧型,也就是人工智慧 artificial intelligence 從上世紀50年代,人工智慧的發展經歷了 推理期 通過賦予機器邏輯推理能力使機器獲得智慧型,當時的ai程式能夠證明一些著名的數學定理,但由於機器缺乏知識,遠不能實現真正的智慧型。因此,70年...