機器學習基石 一 什麼是機器學習

2021-10-21 13:37:37 字數 787 閱讀 7210

機器學習:從data出發,最終目標是提高可以衡量的某方面表現。

可以稱為機器學習的話,這個任務必須有如下三點

沒有簡單的可以定義的解決辦法途徑

例:桌面上有多少件物品是方形的? 這件事情有明確定義,明確的規則,不需要機器學習來**。

如下圖所示:

我們用文字再做一次表達:

data集包括輸入x和輸出y,從x到y的對映,背後是有函式f做支撐。

我們不知道f的形式,所以只能通過大量的data,使用ml對應的假設模型(hypothesis)來生成g

通常情況(非線性)下,g不可能與f完全相同,但是,我們學習機器學習的目的就是為了讓g盡可能的逼近潛在的無法準確定義的f,從而在面對未知的輸入x的時候,我們能夠給出相對準確的y(**)

從定義上來說:資料探勘是從資料中找出一些有趣的有規律的東西。

如果找出「有趣的東西」是找出乙個g來逼近真實值,那麼資料探勘 = 機器學習。

如果找出「有趣的東西」是與機器學習尋找的g相關,那麼資料探勘會幫助到機器學習。

總的來說,他們很像。資料探勘比機器學習的範圍稍微廣一點。

人工智慧的定義:計算機能夠做出有智慧型的決策

機器學習是實現人工智慧的一種途徑。

統計學:使用資料來推斷某個未知的事情。

與機器學習的關係:統計是實現機器學習的方法。(當前最常用的方法)

區別:統計畢竟是數學範疇,重推論,理論與證明。

《機器學習基石》筆記一 機器學習簡介

人類學習是從不斷的觀察獲得經驗的技能。機器學習是從資料出發,通過數 算等方式獲得經驗增強的技能。1 存在一些內部的規則 2 程式設計無法把這個規則定義出來 3 有充足的資料 輸入樣本空間 x x x x x x輸出樣本空間 y y y y y y目標函式 要學習出的模式 f x yf x longr...

機器學習基石 學習型別

二分類 多分類回歸 結構化學習 nlp領域相關 無監督學習 半監督學習 有監督學習 增強學習 沒有真實的輸出y,根據模型的輸出反饋,如果反饋結果良好,更接近真實輸出,就給其正向激勵,如果反饋結果不好,偏離真實輸出,就給其反向激勵。batch learning online learning acti...

機器學習基石(6)

希望m最終能取代m 假設集大小 到底m會不會漲的很慢?假設的數量不會太多?如果長得很慢,能不能取代掉原來的m?mh成長函式 到底這個假設集,在n個點上,到底能產生多少種dichotomies?如果是positive rays,在n 2時候就露出破綻,不能產生那種情形 如果是positive inte...