1. 基本概念:訓練集,測試集,特徵值,監督學習,非監督學習,半監督學習,分類,回歸
2. 概念學習:人類學習概念:鳥,車,計算機
定義:概念學習是指從有關某個布林函式的輸入輸出訓練樣例中推斷出該布林函式
3. 例子:學習
「享受運動
" 這一概念:
小明進行水上運動,是否享受運動取決於很多因素 樣例
天氣溫度
濕度風力
水溫預報
享受運動1晴
暖普通強暖
一樣是2晴
暖大強暖
一樣是3雨
冷大強暖
變化否4晴
暖大強冷
變化是天氣:晴,陰,雨
溫度:暖,冷
濕度:普通,大
風力:強,弱
水溫:暖,冷
預報:一樣,變化
享受運動:是,否
概念定義在例項
(instance)
集合之上,這個集合表示為x。(
x:所有可能的日子,每個日子的值由
天氣,溫度,濕度,風力,水溫,預報6
個屬性表示。
待學習的概念或目標函式成為目標概念(
target concept), 記做c
。 c(x) = 1,
當享受運動時,
c(x) = 0
當不享受運動時,
c(x)
也可叫做y
x: 每乙個例項
x: 樣例,
所有例項的集合
學習目標:
f: x -> y
4. 訓練集(training set/data)/
訓練樣例(
training examples):
用來進行訓練,也就是產生模型或者演算法的資料集
測試集(testing set/data)/
測試樣例
(testing examples)
:用來專門進行測試已經學習好的模型或者演算法的資料集
特徵向量
(features/feature vector)
:屬性的集合,通常用乙個向量來表示,附屬於乙個例項 標記
(label): c(x),
例項類別的標記 正例
(positive example) 反例
(negative example)
5. 例子:研究美國矽谷房價
影響房價的兩個重要因素:面積
(平方公尺),學區(評分
1-10)
樣例面積(平方公尺)學區(
11.2
深度學習
(deep learning)
介紹-10) 房價
(1000$) 1
1008
1000
2120
91300360
6800480
91100595
5850
6.
分類(classification):
目標標記為類別型資料
(category) 回歸
(regression):
目標標記為連續性數值
(continuous numeric value)
7. 例子:研究腫瘤良性,惡性於尺寸,顏色的關係
特徵值:腫瘤尺寸,顏色
標記:良性/惡性
有監督學習
(supervised learning)
:訓練集有類別標記
(classlabel)
無監督學習
(unsupervised learning)
:無類別標記
(classlabel)
半監督學習(
semi-supervised learning)
:有類別標記的訓練集
+無標記的訓練集
8. 機器學習步驟框架
8.1
把資料拆分為訓練集和測試集
8.2
用訓練集和訓練集的特徵向量來訓練演算法
8.2
用學習來的演算法運用在測試集上來評估演算法
(可能要設計到調整引數(
parameter tuning),
用驗證集(
validation set)
100
天:訓練集 10
天:測試集
(不知道是否
」享受運動「,知道6
個屬性,來**每一天是否享受運動)
2 深度學習基本概念
evernote export 1.基本概念 訓練集,測試集,特徵值,監督學習,非監督學習,半監督學習,分類,回歸 2.概念學習 人類學習概念 鳥,車,計算機 定義 概念學習是指從有關某個布林函式的輸入輸出訓練樣例中推斷出該布林函式 3.例子 學習 享受運動 這一概念 小明進行水上運動,是否享受運動...
深度學習之機器學習基本概念
訓練集 用來訓練,產生模型或者演算法的資料集 測試集 用來測試以及學習好的模型或者演算法的資料集,假設只知道特徵不知道結果,用模型得出的結果與已有的結果進行對比 特徵向量 屬性的集合,通常用向量來表示,與具體的例項有關。影響結果的因素 有關 標記 label 對結果類別的標記 正例 正面的結果,比如...
基本概念 2
ecmascript中有5種簡單資料型別 也稱為基本資料型別 undefined null boolean number string。還有一種複雜資料型別 object,本質上是由一組無序的名值隊組成。ecmascript不支援任何建立自定義型別機制,所有值都是上述6種資料型別之一。由於ecmas...