機器學習 二 基本概念

2021-07-15 03:07:57 字數 1821 閱讀 6486

1. 基本概念:訓練集,測試集,特徵值,監督學習,非監督學習,半監督學習,分類,回歸

2. 概念學習:人類學習概念:鳥,車,計算機

定義:概念學習是指從有關某個布林函式的輸入輸出訓練樣例中推斷出該布林函式

3. 例子:學習 「享受運動"  這一概念:

小明進行水上運動,是否享受運動取決於很多因素 樣例

天氣溫度

濕度風力

水溫預報

享受運動1晴

暖普通強暖

一樣是2晴

暖大強暖

一樣是3雨

冷大強暖

變化否4晴

暖大強冷

變化是

天氣:晴,陰,雨

溫度:暖,冷

濕度:普通,大

風力:強,弱

水溫:暖,冷

預報:一樣,變化

享受運動:是,否

概念定義在例項(instance)集合之上,這個集合表示為x。(x:所有可能的日子,每個日子的值由 天氣,溫度,濕度,風力,水溫,預          報6個屬性表示。

待學習的概念或目標函式成為目標概念(target concept), 記做c。

c(x) = 1, 當享受運動時, c(x) = 0 當不享受運動時,c(x)也可叫做y

x: 每乙個例項

x: 樣例, 所有例項的集合

學習目標:f: x -> y

4. 訓練集(training set/data)/訓練樣例(training examples): 用來進行訓練,也就是產生模型或者演算法的資料集

測試集(testing set/data)/測試樣例 (testing examples):用來專門進行測試已經學習好的模型或者演算法的資料集

特徵向量(features/feature vector):屬性的集合,通常用乙個向量來表示,附屬於乙個例項

標記(label): c(x), 例項類別的標記

正例(positive example)

反例(negative example)

5. 例子:研究美國矽谷房價

影響房價的兩個重要因素:面積(平方公尺),學區(評分1-10) 樣例

面積(平方公尺)

學區 (11.2 深度學習(deep learning)介紹-10)

房價 (1000$)

1100

81000

2120

91300360

6800480

91100595

5850

6.  分類 (classification): 目標標記為類別型資料(category) 

回歸(regression): 目標標記為連續性數值 (continuous numeric value)

7. 例子:研究腫瘤良性,惡性於尺寸,顏色的關係

特徵值:腫瘤尺寸,顏色

標記:良性/惡性

有監督學習(supervised learning): 訓練集有類別標記(class label)

無監督學習(unsupervised learning): 無類別標記(class label)

半監督學習(semi-supervised learning):有類別標記的訓練集 + 無標記的訓練集

8. 機器學習步驟框架

8.1 把資料拆分為訓練集和測試集

8.2 用訓練集和訓練集的特徵向量來訓練演算法

8.2 用學習來的演算法運用在測試集上來評估演算法 (可能要設計到調整引數(parameter tuning), 用驗證集(validation set)

100 天: 訓練集

10天:測試集 (不知道是否 」 享受運動「, 知道6個屬性,來**每一天是否享受運動)

機器學習基本概念

什麼是學習?如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。赫爾伯特 西蒙 什麼是機器學習?對於某給定的任務 t 在合理的效能度量方案 p的前提下,電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適,優質,大量的經驗 e 該程式對於任務 t的效能逐步提高。任務,經驗,效能 什麼是統...

機器學習基本概念

1.基本的概念 領域集 乙個任意的集合 集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集 學習器所追求的結果集合。可以為,器想要得到的最終資料。訓練資料 帶標籤的領域及元素集合,通常會組成乙個區域性聚合s,也叫作訓練集。2.機器學習的一般流程 採集資料 標記 訓練 得到 器 乙個學習...

機器學習基本概念

1.基本概念 訓練集 測試集 特徵值 監督式學習 非監督學習 半監督學習 分類 回歸 2.概念學習 概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。3.樣例 天氣 溫度 濕度 風力 水溫 預報 享受運動 1 晴 暖 普通 強 暖 一樣 是 2 晴 暖 大 強 暖 一樣 是 3 雨 冷...