1. 基本的概念
領域集: 乙個任意的集合χ。集合中的例項是我們希望能夠貼上標籤的資料。χ的元素稱為例項。
標籤集:學習器所追求的結果集合。可以為,。**器想要得到的最終資料。
訓練資料: 帶標籤的領域及元素集合,通常會組成乙個區域性聚合s,也叫作訓練集。
2. 機器學習的一般流程
採集資料 –> 標記-> 訓練-> 得到**器
乙個學習演算法的輸入是乙個訓練集s, 訓練集s從乙個未知分布d中取樣得到;
通過目標函式f進行標記;
將s中的帶標籤樣本輸入到學習器中,訓練的目標是使得訓練誤差最小化;
得到乙個最小的**器hs。
3. 什麼損失函式,用它來幹什麼?
**函式h(x)與標記函式f(x)不一致的程度
由於學習器並不知道d和f是什麼樣的,所以無法直接獲得真是誤差。
此時就會應用到另乙個誤差 – 訓練誤差。
訓練誤差的表示:
其中[m]= .
4. 分析過擬合與欠擬合。
複雜度低,泛化能力差,人工設計痕跡過重;
通俗的講,就是通過有限的訓練集s,『人工』找到乙個能夠使得訓練集s中所有訓練樣本都能夠得到。
有上述得到的是過擬合的,並不具有泛化能力。
5. 過擬合的解決方法。
歸納偏執
在學習器接觸到資料之前,選定乙個**器的集合;
**器集合的選取依賴於先驗知識;
6.機器學習開源庫
坊間流傳,alphago即是基於tensorflow來進行訓練的?
機器學習基本概念
什麼是學習?如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。赫爾伯特 西蒙 什麼是機器學習?對於某給定的任務 t 在合理的效能度量方案 p的前提下,電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適,優質,大量的經驗 e 該程式對於任務 t的效能逐步提高。任務,經驗,效能 什麼是統...
機器學習基本概念
1.基本概念 訓練集 測試集 特徵值 監督式學習 非監督學習 半監督學習 分類 回歸 2.概念學習 概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。3.樣例 天氣 溫度 濕度 風力 水溫 預報 享受運動 1 晴 暖 普通 強 暖 一樣 是 2 晴 暖 大 強 暖 一樣 是 3 雨 冷...
機器學習 基本概念
1 定義 訓練好的分類器對訓練樣本很好的分類,但是對測試樣本的分類結果很糟糕。2 原因 特徵維度過多,導致擬合的函式完美的經過訓練集,但是對新資料的 結果則較差。3 解決方法 減少特徵維度 可以人工選擇保留的特徵,或者模型選擇演算法 正則化 保留所有的特徵,通過降低引數 的值,來影響模型 1 定義 ...