1.1若**離散值,此類學習任務稱為「分類」;若**連續值,此類學習任務稱為「回歸」;
1.2此外還可以進行「聚類」,即將訓練集中的物件分成若干組,每組稱為乙個「簇」;這些自動形成的簇可能對應一些潛在的概念劃分。
2.1根據訓練資料是否擁有標記資訊,學習任務可大致劃分為兩大類:「監督學習」和「無監督學習」,分類和回歸是前者的代表,聚類則是後者的代表。
2.2演算法在學習過程中對某種型別假設的偏好,稱為「歸納偏好」。
人工智慧的發展中必然產物-機器學習。
二十世紀八十年代,「從樣例中學習」的一大主流是符號主義學習,其代表包括決策樹和基於邏輯學習。
典型的決策樹學習以資訊理論為基礎,以資訊熵的最小化為目標,直接模擬了人類對概念進行判定的樹形流程。
基於邏輯的學習的著名代表是歸納邏輯程式設計。可看作機器學習與邏輯程式設計的交叉,它使用一階邏輯來進行知識表示,通過修改和擴充邏輯表示式來完成對資料的歸納。
二十世紀九十年代中期之前,「從樣例中學習」的另乙個主流技術是基於神經網路的連線主義學習。
二十世紀九十年代中期。「統計學習」開始風靡。代表性技術是支援向量機(support vector machine, svm)以及更一般的方法「核方法」。
二十世紀初,連線主義學習又捲土重來,「深度學習」開始流行。因為計算能力的提高,大資料的發展。
機器學習基礎概念筆記
監督學習 分類和回歸屬於監督學習。這類演算法必須知道 什麼,即目標變數的分類資訊。常見演算法 k 近鄰演算法 線性回歸 樸素貝葉斯演算法 支援向量機 決策樹 lasso最小回歸係數估計 ridge回歸 區域性加權線性回歸 無監督學習 資料沒有類別資訊,不給定目標值。常見演算法 k 均值 最大期望演算...
周志華 機器學習 筆記(零) 概念
模型 model 泛指從資料中學得的結果。訓練資料 training data 訓練過程中使用的資料。訓練樣本 training sample 訓練資料中的每個樣本。訓練集 training set 訓練樣本組成的集合。假設 hypothesis 學得模型對應了關於資料的某種潛在的規律。真相 真實 ...
機器學習筆記 基本概念
首先我們以人來舉例 你在買蘋果的時候,看到乙個蘋果,它黃裡透紅 果皮粗糙 硬度稍軟,我們就可以判斷它比較甜,這是因為我們已經有了類似的經驗,通過對經驗的應用就可以做出相應的判斷。這種對經驗的利用是我們自發形成的,但是機器是否能做到呢。機器學習就是這樣一門學科,它致力於研究如何通過計算的手段,利用經驗...