監督學習
以已知結果的資料集作為訓練樣本。
基本流程:輸入資料 -> 特徵工程 -> 模型訓練 -> 模型部署 -> 模型應用。
監督學習的目的在於學習乙個由輸入到輸出的對映,這一對映由模型來表示,也就是說學習的目的就在於找到最好的這樣的模型。模型屬於由輸入空間到輸出空間的對映集合,這個集合就是假設空間。
假設空間的確定意味著學習範圍的確定。
輸入空間(input space)
將輸入的所有可能取值的集合稱作輸入空間。
輸出空間(output space)
將輸出的所有可能取值的集合稱作輸出空間。
特徵(feature)
特徵:即屬性,每個輸入例項的各個組成部分(屬性)稱作原始特徵,基於原始特徵還可以擴充套件出更多的衍生特徵。
特徵是對乙個事物的客觀屬性描述,也是一事物異於其他事物的特點。
於己而言,特徵是某些突出性質的表現;於他而言,特徵是區分事物的關鍵。
特徵向量(feature vector)
由多個特徵組成的集合,稱作特徵向量,x維。
特徵空間(feature space)
將特徵向量存在的空間稱作特徵空間。
假設空間(hypothesis space)
由輸入空間到輸出空間的對映的集合,稱作假設空間。
針對每一種可能的輸入,都能找到乙個對映,對應了輸出空間中某個輸出。
假設空間指的是問題所有假設組成的空間,可以把學習過程看作是在假設空間中搜尋的過程,搜尋目標是尋找與訓練集「匹配」的假設。
版本空間:與訓練集一致的「假設集合」。
特徵工程
最大限度地從原始資料中提取特徵以供演算法和模型使用。
crisp-dm流程
十行**感知機器學習:
ML 基本概念
機器學習最早是由一位人工智慧領域的先驅arthur samuel在1959年提出來的。本意指的是一種讓計算機在不經過明顯程式設計的情況下,對資料進行學習,並且做出 的方法,屬於電腦科學領域的乙個子集。公認的世界上第乙個自我學習專案就是samuel跳棋遊戲 在機器學習領域,有監督學習和無監督學習是兩種...
ML 基本概念
ml 基本概念 一.機器學習的起源 機器學習最早是由一位人工智慧領域的先驅arthur samuel在1959年提出來的。本意指的是一種讓計算機在不經過明顯程式設計的情況下,對資料進行學習,並且做出 的方法,屬於電腦科學領域的乙個子集。公認的世界上第乙個自我學習專案就是samuel跳棋遊戲 二.有監...
機器學習筆記 基本概念
首先我們以人來舉例 你在買蘋果的時候,看到乙個蘋果,它黃裡透紅 果皮粗糙 硬度稍軟,我們就可以判斷它比較甜,這是因為我們已經有了類似的經驗,通過對經驗的應用就可以做出相應的判斷。這種對經驗的利用是我們自發形成的,但是機器是否能做到呢。機器學習就是這樣一門學科,它致力於研究如何通過計算的手段,利用經驗...