機器學習專門研究計算機怎樣模擬或實現人類的學習行為,根據過往的經驗對一類問題形成某種認識或總結出一定的規律,然後利用這些規律來對新的問題進行**。並且可以持續根據新的知識,重新組織已有的知識結構使之不斷改善自身的效能。
機器學習根據是否有目標值可以分為以下幾種:
1. 監督學習
每個訓練資料樣本都有對應的期望值也就是目標值,進行機器學習的過程實際上就是特徵值和目標佇列對映的過程。
1)當目標值是有限的離散值時,稱為分類。如下圖,通過對已知樣本的特徵及腫瘤良/惡性進行學習,可以**出新樣本的腫瘤型別。而腫瘤型別只有良性、惡性兩種。
2)當目標值是連續的值時,稱為回歸。如下圖,小區房價是連續的數值,不存在類別之分。
2. 無監督學習
訓練樣本不依賴於目標值的機器學習演算法。輸出資料沒有被標記,也沒有確定的結果。需要根據樣本間的相似性對樣本集進行類別劃分,它主要是用來解決一些聚類場景的問題。如下圖,雖然樣本點沒有目標值,但是它們都有相似的屬性特徵,可以通過機器學習將類似特徵的樣本點聚集在一起。
3. 半監督學習
半監督學習介於監督和無監督學習的中間地帶:它的樣本一部分有目標值,同時存在著大量沒有目標值的樣本。
半監督學習演算法使用有限的標記樣本資料集來訓練自己,從而形成乙個「部分訓練」的模型。部分訓練的模型對未標記的資料進行標記,標記的結果被認為是「偽標籤」資料。結合標記和偽標籤資料集,通過演算法,結合描述和**方面的監督和非監督學習。
在實際業務應用中一般是監督學習的方式,即所有樣本均有目標值。
具體離散型目標值的分類方法、連續型目標值的回歸方法將在後續說明。
機器學習的分類
嚴格意義上來說,機器學習可以分為以下幾類 有監督學習,無監督學習,半監督學習,強化學習。有監督學習是指在訓練過程中的資料是同時又特徵和標籤的,也就是說模型在訓練過程中是知道正確結果的,模型可以根據標籤為指導進行引數調整,這種學習方式好像學習被監督了一樣,因此監督學習的意義為 學習的過程有標籤作為指導...
機器學習(1) 機器學習的分類
第二種分類方式 本文是imooc python3入門機器學習 的學習筆記,用於整理自己學習到的概念,用以備查。簡單說來,就是對於學習對於所要求的資料集,是否需要標註。常見的監督學習演算法有 常見的 非監督演算法及其用處見下 出於各種原因,資料集可能出現一部分資料集帶有標記,而另一部分則缺失標記。此時...
機器學習分類
監督學習是從標記的訓練資料來推斷乙個功能的機器學習任務。訓練資料報括一套訓練示例。在監督學習中,每個例項都是由乙個輸入物件 通常為向量 和乙個期望的輸出值 也稱為監督訊號 組成。監督學習演算法是分析該訓練資料,並產生乙個推斷的功能,其可以用於對映出新的例項。主要有 非監督學習是在未加標籤的資料中,試...