在機器學習中涉及到很多的工具,其中最重要的當屬數學工具。機器學習涉及到的資料工具總共有三種,分別是線性代數、概率統計和最優化理論。在這篇文章中我們就來詳細給大家介紹一下這些知識,讓大家在日常的機器學習中可以更好地運用到數學工具。
然後我們說一下概率統計,在評價過程中,我們需要使用到概率統計。概率統計包括了兩個方面,一方面是數理統計,另外一方面是概率論。一般來說數理統計比較好理解,我們機器學習當中應用的很多模型都是**於數理統計。像最簡單的線性回歸,還有邏輯回歸,它實際上都是**於統計學。在具體地給定了目標函式之後,我們在實際地去評價這個目標函式的時候,我們會用到一些概率論。當給定了乙個分布,我們要求解這個目標函式的期望值。在平均意義上,這個目標函式能達到什麼程度呢?這個時候就需要使用到概率論。所以說在評價這個過程中,我們會主要應用到概率統計的一些知識。
最後我們說一下最優化理論,其實關於優化,就不用說了,我們肯定用到的是最優化理論。在最優化理論當中,主要的研究方向是凸優化。凸優化當然它有些限制,但它的好處也很明顯,比如說能夠簡化這個問題的解。因為在優化當中我們都知道,我們要求的是乙個最大值,或者是最小值,但實際當中我們可能會遇到一些區域性的極大值,區域性的極小值,還有鞍點這樣的點。凸優化可以避免這個問題。在凸優化當中,極大值就是最大值,極小值也就是最小值。但在實際當中,尤其是引入了神經網路還有深度學習之後,凸優化的應用範圍越來越窄,很多情況下它不再適用,所以這裡面我們主要用到的是無約束優化。同時,在神經網路當中應用最廣的乙個演算法,乙個優化方法,就是反向傳播。
機器學習中涉及到的演算法有哪些(下)
首先我們給大家介紹一下boosting 和 adaboost,首先,boosting 是一種整合技術,它試圖整合一些弱分類器來建立乙個強分類器。這通過從訓練資料中構建乙個模型,然後建立第二個模型來嘗試糾正第乙個模型的錯誤來完成。一直新增模型直到能夠完美 訓練集,或新增的模型數量已經達到最大數量。而a...
機器學習涉及到應用(一)
由於現在人工智慧的火熱,接連著也推動了機器學習的高潮,而機器學習是現在很多技術的基礎,比如說資料探勘 統計學習 計算機視覺等等廣泛使用的技術。我們在這篇文章中就給大家介紹一下關於機器學習涉及到的應用,希望這篇文章能夠幫助大家更好的理解機器學習的知識。首先我們給大家介紹一下資料探勘,我們可以認為資料探...
機器學習中涉及到的演算法有哪些(特別篇)
機器學習中最重要的演算法有兩種,第一種是支援向量機演算法,第二種是隨機森林演算法。在這篇文章中我們就重點介紹一下這兩種演算法的相關知識。希望能夠幫助大家更好的理解機器學習。首先我們介紹一下支援向量機演算法 svm 就目前而言,支援向量機可能是最受歡迎和最廣泛討論的機器學習演算法之一。而超平面是分割輸...