機器學習 1 基本概念

2022-01-16 14:51:34 字數 1150 閱讀 1641

訓練集(training set/data)/訓練樣例(training examples):用來進行訓練,也就是產生模型或者演算法的資料集。

測試集(testing set/data)/測試樣例(testing examples):用來專門進行測試已經學習好的模型或者演算法的資料集。

特徵向量(features vector):屬性的集合,通常用乙個向量來表示,附屬於乙個例項。

注意:這裡的特徵向量不是指線性代數中的特徵向量。

標記(label):例項類別的標記。用於監督學習。

正例(positive example):例如標記中的「正確」。

反例(negative example):例如標記中的「錯誤」。

分類(classification):目標標記為類別型(不連續)資料(category),例如去、不去,是、否等。

回歸(regression):目標標記為連續性數值(continuous numeric value),例如房價、分數等。

我們在訓練模型時,按照訓練集中是否包含類別標記,可以分為以下幾種:

有監督學習(supervised learning):訓練集有類別標記(class label)。

無監督學習(unsupervised learning):訓練集無類別標記。

半監督學習(semi-supervised learning):有類別標記的訓練集 + 無標記的訓練集。

1.把資料拆分為訓練集和測試集

2.用訓練集來訓練演算法(模型 model)

3.用學習來的演算法(模型)運用在測試集上進行評估,調整引數(parameter tuning)等。

機器學習(1) 基本概念

神經網路技術起源與上世紀50年代。當時叫做感知機。擁有輸入層,輸出層和乙個隱含層。這種感知機被稱為單層感知機 1959,機器學習被定義為不直接程式設計的情況下賦予計算機學習能力。1974年哈佛大學的paul werbos發明bp演算法。bp演算法正是用來求解這種多層復合函式的所有變數的偏導數的利器。...

機器學習1 基本概念

1.機器學習定義 機器學習 arthur samuel,1959 在確定程式設計之外給予計算機學習能力的研究領域。機器學習 tom mitchell,1998 如果電腦程式對於任務t的效能度量p通過經驗e得到了提高,則認為此程式對e進行了學習。2.機器學習四個主要內容 監督學習 包括回歸 連續性問題...

機器學習1 基本概念

參考 資料集 色澤 青綠 根蒂 蜷縮 敲聲 濁響 色澤 墨綠 根蒂 稍蜷 敲聲 沉悶 色澤 淺白 根蒂 硬挺 敲聲 清脆 基本概念 1 樣本 這批資料裡的每對括號。2 資料集 樣本的集合。3 特徵 屬性 色澤 根蒂 敲聲等反映事物的本質的可觀察方面。4 屬性值 青旅 墨綠 蜷縮 濁響等,是屬性的取值...