有監督學習 無監督學習 分類 聚類 回歸等概念

2021-07-10 13:21:09 字數 1927 閱讀 9344

這篇是很久之前寫的了.. 後來才開始上 andrew ng 老師的 mooc,發現其實老師講得很好了,建議有時間看看他的《machina learning》,只看第一節課就可以很了解這些概念了。

主要內容

有監督學習、無監督學習、分類、聚類、回歸等概念

這裡舉乙個給書本分類的例子。部分參考 什麼是無監督學習? - 王丰的回答 - 知乎 。

特徵(feature)

資料的特徵。

書的內容。

標籤(label)

資料的標籤。

書屬於的類別,例如「計算機」「圖形學」「英文書」「教材」等。

學習(learning)

把很多書交給乙個學生,培養他給書本分類的能力。

有監督學習(supervised learning)

不僅把訓練資料丟給計算機,而且還把分類的結果(資料具有的標籤)也一併丟給計算機分析。

由於計算機在學習的過程中不僅有訓練資料,而且有訓練結果(標籤),因此訓練的效果通常不錯。訓練結束之後進行測試

不僅把書給學生進行訓練給書本分類的能力,而且把分類的結果(哪本書屬於哪些類別)也給了學生做標準參考。

計算機進行學習之後,再丟給它新的未知的資料,它也能計算出該資料導致各種結果的概率,給你乙個最接近正確的結果。

無監督學習(unsupervised learning)

只給計算機訓練資料,不給結果(標籤),因此計算機無法準確地知道哪些資料具有哪些標籤,只能憑藉強大的計算能力分析資料的特徵,從而得到一定的成果,通常是得到一些集合,集合內的資料在某些特徵上相同或相似。

只給學生進行未分類的書本進行訓練,不給標準參考,學生只能自己分析哪些書比較像,根據相同與相似點列出清單,說明哪些書比較可能是同一類別的。

半監督學習(semi-supervised learning)

給計算機大量訓練資料與少量的分類結果(具有同一標籤的集合)。

給學生很多未分類的書本與少量的清單,清單上說明哪些書屬於同一類別。

聚類(clustering)

無監督學習的結果。聚類的結果將產生一組集合,集合中的物件與同集合中的物件彼此相似,與其他集合中的物件相異。

沒有標準參考的學生給書本分的類別,表示自己認為這些書可能是同一類別的(具體什麼類別不知道)。

分類(classification)

有監督學習的兩大應用之一,產生離散的結果。

例如向模型輸入人的各種資料的訓練樣本,產生「輸入乙個人的資料,判斷是否患有癌症」的結果,結果必定是離散的,只有「是」或「否」。

回歸(regression)

有監督學習的兩大應用之一,產生連續的結果。

例如向模型輸入人的各種資料的訓練樣本,產生「輸入乙個人的資料,判斷此人20年後今後的經濟能力」的結果,結果是連續的,往往得到一條回歸曲線。當輸入自變數不同時,輸出的因變數非離散分布。

看不懂可以再看看下面這個例子:)

什麼是無監督學習? - 王丰的回答 - 知乎

有監督學習 無監督學習 分類 聚類 回歸等概念

這篇是很久之前寫的了.後來才開始上 andrew ng 老師的 mooc,發現其實老師講得很好了,建議有時間看看他的 machina learning 只看第一節課就可以很了解這些概念了。主要內容 有監督學習 無監督學習 分類 聚類 回歸等概念 這裡舉乙個給書本分類的例子。部分參考 什麼是無監督學習...

有監督學習和無監督學習 無監督學習

一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...

有監督學習 無監督學習與半監督學習

這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。但根據知乎慣例,答案還是要繼續擴充套件的。首先看什麼是學習 learning 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必...