機器學習筆記 監督學習 無監督學習分類筆記

2021-10-23 16:32:31 字數 1580 閱讀 2941

無監督學習

給出一資料組,並已知曉這組資料的對應關係,然後給出一組新的資料,嘗試對其進行**和分析,這裡注意,提前給出的資料組(data set)是已知內部的資料的對應關係,後面給出的新的資料,是要依據對之前資料的學習後,給出新的資料對應的**值。而對於**的結果的不同,又將監督學習分為分類(classfication)和回歸(regression)

比如下列子:

已知某地區的房屋面積和對應的房價,然後要求對某個確定的房屋尺寸,做出對應的房價**。

這裡注意,已有的資料點(圖中紅色的×),是一致的資料組中的資料對應關係,現在要對新的房屋面積(圖中綠色的750)做出房價預估,這裡的預估結果是乙個大致的資料值,對於預估資料值的問題型別,可以將其理解為回歸問題。就是將新的**物件的目標值分析對應到某乙個具體的資料集中。比如下圖中最後的「對房屋面積為750的房子的預估**為200k」,這裡最後的「200k」是在前期的資料分析得出的乙個結果範圍中。是乙個具體的數值。

簡單的理解,同樣是監督學習的範疇,就是對已知資料集,並且知道這些資料集之間的對應關係,然後給出乙個新的資料,我們對新的資料的**值僅為『0』或』1『的這樣的乙個分類。即最後的**結果並非是乙個大致的數值,而是乙個類別,比如』好『和』壞『,』對『或』錯『等。

比如:已知一些腫瘤的對應關係,圖中橫軸為腫瘤大小,縱軸為良性還是惡性,圖中藍色×為良性,紅色×為惡性。現在給出乙個尺寸的腫瘤(圖中粉色箭頭位置),現在要**這個腫瘤是良性的還是惡性的,這個結果要麼是良性,要麼是惡性,其實就是』0『和』1『的判斷結果,所以這個問題其實是分類問題。

無監督學習和監督學習可以從下面圖中看出大概

左圖中給出的資料集是已知的兩種資料關係,並且做好分類了(圈和×),右圖中給出的已知資料集沒有做任何標識(均為圈),若對這兩種情況的資料做分類,如下圖:

左側的很簡單,根據已知資料點的型別,用演算法將其分開即可,然而對於右側的無監督學習,應為沒有給出資料點之間的關係,從圖中看,只能通過尋找這些資料之間的關係而將其分類,比如圖中依據資料之間的聚集度將其分為兩大類,即右圖中兩個綠色的圈圈所示。

對監督學習和非監督學習做個簡單總結:

對於給出的資料集,若已知資料集之間的相互關係(如房屋面積和對應房價),則為監督學習;若不知對應關係(如上面右圖的資料,最後被兩個綠色的圈圈分開),則為非監督學習。

在監督學習中,若**結果為某個確定的數值,此型別為回歸問題,若**結果為簡單的分類,即類似於非0即1的,就為分類

機器學習筆記 監督學習,無監督學習,半監督學習

這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。什麼是學習 learning 學習 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必做過,但在高中三年我們做過很多很多題目,懂...

機器學習日記 監督學習 無監督學習

監督學習是指 利用一組已知類別的樣本調整 分類器的 引數,使其達到所要求效能的過程,也稱為 監督訓練或有教師學習。無監督學習 現實生活中常常會有這樣的問題 缺乏足夠的 先驗知識 因此難以人工標註類別或進行人工類別標註的成本太高。很自然地,我們希望計算機能代我們完成這些工作,或至少提供一些幫助。根據類...

有監督學習和無監督學習 無監督學習

一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...