從廣義上來說,機器學習是一種賦予機器學習的能力,依此讓它完成直接程式設計無法完成的功能的方法。
但是從實踐的意義來說,機器學習是一種通過利用資料,訓練處模型,再使用模型**的一種方法。
拿國民話題的房子來說,現在我要賣一棟房子,售價多少?房子的面積是100平公尺,**是100萬,120萬還是140萬?
很顯然,我希望獲得房價與面積的某種規律。那麼我該如何獲得這個規律?用報紙或網上的平均資料?參考別人面積相似的?無論哪種,都不靠譜!
我現在希望獲得乙個合理的,並且能夠最大程度地反應面積與房價關係的規律。於是我調查了周邊與我房型類似的一些房子,獲得一組資料。我希望從這組資料中找到面積和**的關係,最終得到我房子的準確售價。
對該規律的尋找,很簡單。擬合出一條直線,讓它「穿過」所有的點,並且與各個點的距離盡可能小。通過這條直線,我獲得了乙個能夠最佳反應房價與面積的規律,如下函式:
房價=面積*a+b
假設a=0.75,b=50,則房價=100*0.75=125萬,這個結果與我前面所列的100萬、120萬、140萬都不一樣。由於這條直線綜合了大部分的情況,因此,從「統計」的角度來說,125萬是個最合理的**。
在求解過程中,透漏出了2個資訊:
1.房價模型是根據擬合的函式型別決定的。如果是直線,那麼擬合出的就是直線方程。如果是其他型別的線,如拋物線,那麼擬合出的就是拋物線方程。機器學習有眾多演算法,一些強力演算法可以擬合出複雜的非線性模型,用來反映一些不是直線所能表達的情況。
2.如果我的資料越多,我的模型就能考慮越多的情況,由此對新情況的**效果可能就更好。這就是機器學習界「資料為王」思想的乙個體現。一般來說(不是絕對),資料越多,最後機器學習生成的模型**的效果就越好。
機器學習的過程:
(1)在計算機儲存歷史的資料;
(2)通過計算機演算法處理資料,即「訓練」,處理的結果就是模型;
(3)使用模型對新資料進行**,即「**」;
「訓練」與「**」是機器學習的兩個過程。「模型」是「訓練」的中間輸出結果。「訓練」產生「模型」,「模型」指導「**」。
人類對「經驗」進行「歸納」,獲得了生活的「規律」。當人們遇到新問題或對未來進行「推測」時,就會利用這些「規律」,為新問題與未來進行「**」。
從上圖可以發現,機器學習中的「訓練」與「**」可以對應到人類的「歸納」和「**」。通過對比,可以發現,機器學習的思想並不複雜,僅僅是對人類在生活中成長的乙個模擬。
機器學習入門
研究生考試結束了,考研通知書也在幾天前到手了,是時候安心下來考慮一下未來研究生的生活和學習了,看現在機器學習特別的火,所以我就先跟風學習一下機器學習吧。由於剛開始學習,所以對一些專有名詞不是很熟悉,所以特別做了一下總結,因為剛剛入門,所以就先整理了這些。人工智慧 一 認知和感知 區別看待 目前是在感...
機器學習入門
1.常用演算法 決策樹 隨機森林演算法 邏輯回歸 svm 樸素貝葉斯 knn演算法 k means演算法 adaboost 演算法 神經網路 馬爾可夫 2.聚類和分類的區別 分類 比如有一堆資料,你已經事先對他們做好了分類。你想要的功能就是,假如來了一條測試資料,我想知道他是哪一類,這就是分類。聚類...
機器學習入門
機器學習現在有著非常多的應用,從人臉識別到自動駕駛使用的都是機器學習的技術,機器學習在當前是乙個十分熱門的話題,也是引領下乙個技術變革的方向之一。大量的人員開始關注起機器學習,從初學者再到有經驗的技術人員,投身到機器學習中。但機器學習並不像普通的程式設計一樣,機器學習的入門有一定的門檻,因為機器學習...