二 機器學習之路 什麼是機器學習

2021-08-09 23:18:11 字數 1368 閱讀 4557

寫在前面:本部落格所寫內容均為本人自學筆記,如有錯誤之處,還請各位大神多多指教,謝謝。tom mitchell在他的《machine learning》書中給出了乙個簡單明瞭的定義:

「機器學習這門學科所關注的問題是:電腦程式如何隨著經驗積累自動提高效能。」

說白了就是一套計算機**在實現乙個功能的過程中,不斷通過大量資料的積累學習,來修正其模型引數使其更加準確的過程。能讓你的模型更加趨於完美的就是資料,海量的資料,經過不斷的修正,最終讓你的模型能夠更加的貼切的擬合出準確的資料,誤差最小。

同時tom mitchell又給出了另外一種更加學術的描述,「對於某類任務t和效能度量p,如果乙個電腦程式在t上以p衡量的效能隨著經驗e而自我完善,那麼我們稱這個電腦程式在從經驗e學習。」

簡單的說就是,任務t就是我們寫這段**的目的,比如我們想通過這段**來實現乙個根據房子大小面積等特徵來**房價的模型。效能度量p就是評價你所構建的這套模型的準確度,就是你**房價的誤差,誤差越小則效能越好。經驗e則是目前我們手中已經有的資料,比如我們現在手裡已經有了某個城區的100套房子的面積和**的真實資料。我們要做的就是構建乙個模型,然後利用這100組資料去訓練這個模型,將這100組數」喂」給這個模型之後,讓其根據這100組資料來不斷修正模型引數來自我完善,最終我們任意將乙個房子的大小輸入模型,該模型會輸出這個房子的**。

示例:房子尺寸/平方公尺

房子**/萬

100120

8092

120143

7587

6060

4350

將以上資料用散點圖畫出來,如下圖所示:

構建乙個模型來推測房價,然後根據這6組資料來訓練模型,最終輸出的模型如下圖中擬合的線。

當然這條擬合的線應該向兩端延伸,由於為了作圖方便直接用了excel裡的趨勢線。最終我們的模型輸出就是這條擬合的曲線,當我們利用這條曲線來**房價的時候就可以根據輸入的房子尺寸,對應輸出房子**了。

(當然該例子過於簡單,影響房子**的因素太多,不限於大小,僅供大家理解)

看完了上面的描述,是不是對機器學習有了點概念,當然機器學習的內容不限於以上的介紹,接下來會涉及到不同的機器學習中的技術,隨著學習的深入大家對機器學習會有更深入的了解。如果有不太懂的同學,沒關係,不用擔心,隨著後面不斷深入的學習,心中的疑惑都會迎刃而解。

機器學習1 什麼是機器學習

原文 arthur samuel定義機器學習為,在無特定程式設計的情況下,給予計算機學習能力的領域。這個定義不正式而又古老。tom mitchell提供了乙個更現代的定義 乙個程式被認為能從經驗e中學習,解決任務 t,達到 效能度量值p,當且僅當,有了經驗e後,經過p評判,程式在處理 t 時的效能有...

機器學習 入門 什麼是機器學習?

接觸機器學習有一段時間了,有些東西還是要記錄下來才有意義。從本篇開始,我將持續更新關於機器學習的內容,非常適合新手入門或小白來學習。今天來介紹一下機器學習的整體框架,為我們之後章節的學習鋪平道路。根據定義,可以發現機器學習的三大組成要素 任務 模型 特徵,如圖所示是它們之間的關係。注意 在很多情況下...

機器學習之路(二)

大資料目前應用廣泛,在我看來,現在社會,資料無處不在。大資料是以資料為核心,是乙個圍繞大資料生命週期不斷迴圈往復的生產過程,但也需要很多行業協作和配合。資料主要分為 收集 儲存 建模 分析和產品輸出幾個階段。目前,收集是通過各種軟體應用收集或者裝置收集 儲存通過網路,雲計算進行儲存,通過資料科學家或...