無監督學習

2021-08-17 11:05:57 字數 944 閱讀 7656

【基礎概念】通俗地講:非監督學習(unsupervised learning)指的是人們給機器一大堆沒有分類標記的資料,讓機器可以對資料分類、檢測異常等。

【念 基礎概念 8】聚類是一種探索性資料分析技術,在沒有任何相關先驗資訊的情況下(相當於不清楚資料的資訊),它可以幫助我們將資料劃分為有意義的小的別 組別(也叫簇 cluster)。其中每個簇內部成員之間有一定的相似度,簇之間有較大的不同。這也正是聚類作為無監督學習的原因。

下圖中通過聚類方法根據資料的x_1和x_2兩個特徵值之間的相似性將無類標的資料劃分到三個不同的組中。

【例子】我們可以用下圖表示西瓜的色澤和敲聲兩個特徵,分別為x_1和x_2,我們可以將訓練集中的西瓜分成若干組,每一組稱為乙個「簇」,這些自動形成的簇可能對應一些潛在的概念劃分,如「淺色瓜」、「深色瓜」、「本地瓜」或「外地瓜」。通過這樣的學習我們可以了解到資料的內在規律,能為更深入地分析資料建立基礎。

需要注意的是我們事先並不知道西瓜是本地瓜、淺色瓜,而且在學習過程中使用的訓練樣本通常不擁有標記(label)資訊。

【基礎概念】資料降維(dimensionality reduction)是無監督學習的另乙個子領域。通常,面對的資料都是高維的,這就對有限的資料儲存空間以及機器學習演算法效能提出了挑戰。無監督降維是資料特徵預處理時常用的技術,用於清除資料中的雜訊,能夠在最大程度保留相關資訊的情況下將資料壓縮到額維度較小的子空間,但是同時也可能會降低某些演算法準確性方面的效能。

如下圖乙個三維空間的資料對映到二維空間的例項。

有監督學習和無監督學習 無監督學習

一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...

無監督學習與監督學習

1.無監督和有監督的理解方法有很多,主要可以從以下幾方面來理解 1 無監督與監督學習的區別在於乙個無教學值,乙個有教學值。但是,個人認為他們的區別在於無監督學習一般是採用聚簇等演算法來分類不同樣本。而監督學習一般是利用教學值與實際輸出值產生的誤差,進行誤差反向傳播修改權值來完成網路修正的。但是無監督...

監督學習和無監督學習

機器學習要解決的第一類問題是分類問題。機器學習的另一項任務是回歸,它主要用於 數值型資料。大多數人可能都見過回歸的例子 資料擬合曲線 通過給定資料點的最優擬合曲線。分類和回歸都屬於監督學習,之所以稱之為監督學習,是因為這類演算法必須知道 什麼,即目標變數的分類資訊。與監督學習對應的是無監督學習,此時...