1 特徵(feature)
資料的特徵。
舉例:書的內容
2 標籤(label)
資料的標籤。
舉例:書屬於的類別,例如「計算機」「圖形學」「英文書」「教材」等。
舉例:把很多書交給乙個學生,培養他給書本分類的能力。
4 分類(classification)
定性輸出稱為分類,或者說是離散變數**。
舉例:**明天是陰、晴還是雨,就是乙個分類任務。
5 回歸(regression)
定量輸出稱為回歸,或者說是連續變數**;
舉例:**明天的氣溫是多少度,這是乙個回歸任務;
6 聚類(clustering)
無監督學習的結果。聚類的結果將產生一組集合,集合中的物件與同集合中的物件彼此相似,與其他集合中的物件相異。
不僅把訓練資料丟給計算機,而且還把分類的結果(資料具有的標籤)也一併丟給計算機分析。
計算機進行學習之後,再丟給它新的未知的資料,它也能計算出該資料導致各種結果的概率,給你乙個最接近正確的結果。
由於計算機在學習的過程中不僅有訓練資料,而且有訓練結果(標籤),因此訓練的效果通常不錯。
有監督學習的結果可分為兩類:分類或回歸。
只給計算機訓練資料,不給結果(標籤),因此計算機無法準確地知道哪些資料具有哪些標籤,只能憑藉強大的計算能力分析資料的特徵,從而得到一定的成果,通常是得到一些集合,集合內的資料在某些特徵上相同或相似。
有監督學習和無監督學習的中間帶就是半監督學習(semi-supervised learning)。對於半監督學習,其訓練資料的一部分是有標籤的,另一部分沒有標籤,而沒標籤資料的數量常常遠遠大於有標籤資料數量(這也是符合現實情況的)。
隱藏在半監督學習下的基本規律在於:資料的分布必然不是完全隨機的,通過一些有標籤資料的區域性特徵,以及更多沒標籤資料的整體分布,就可以得到可以接受甚至是非常好的分類結果。
舉例:給學生很多未分類的書本與少量的清單,清單上說明哪些書屬於同一類別。
從不同的學習場景看,ssl可分為四大類:
1 半監督分類
半監督分類(semi-supervised classification):是在無類標籤的樣例的幫助下訓練有類標籤的樣本,獲得比只用有類標籤的樣本訓練得到的分類器效能更優的分類器,彌補有類標籤的樣本不足的缺陷,其中類標籤 取有限離散值。
2 半監督回歸
半監督回歸(semi-supervised regression):在無輸出的輸入的幫助下訓練有輸出的輸入,獲得比只用有輸出的輸入訓練得到的回歸器效能更好的回歸器,其中輸出取連續值。
3 半監督聚類
半監督聚類(semi-supervised clustering):在有類標籤的樣本的資訊幫助下獲得比只用無類標籤的樣例得到的結果更好的簇,提高聚類方法的精度。
4 半監督降維
半監督降維(semi-supervised dimensionality reduction):在有類標籤的樣本的資訊幫助下找到高維輸入資料的低維結構,同時保持原始高維資料和成對約束(pair-wise constraints)的結構不變,即在高維空間中滿足正約束(must-link constraints)的樣例在低維空間中相距很近,在高維空間中滿足負約束(cannot-link constraints)的樣例在低維空間中距離很遠。
有監督學習和無監督學習 無監督學習
一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...
機器學習中的有監督學習,無監督學習,半監督學習
在機器學習 machine learning 領域,主要有三類不同的學習方法 監督學習 supervised learning 非監督學習 unsupervised learning 半監督學習 semi supervised learning 監督學習 通過已有的一部分輸入資料與輸出資料之間的對應...
有監督學習 無監督學習與半監督學習
這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。但根據知乎慣例,答案還是要繼續擴充套件的。首先看什麼是學習 learning 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必...