機器學習個人筆記(三)之無監督學習

2021-10-25 05:29:30 字數 682 閱讀 5741

前言:

宣告:本定義僅為個人理解,並非是官方專業定義

無監督學習即,讓機器通過某種演算法,自動的從一堆資料集裡區分開來不同屬性的資料,然後當機器具有區分類別的能力之後,再給他乙個他沒見過的樣本,讓他用他的能力來識別這個樣本屬於哪一類。

這部分會給出幾個例子來幫助理解什麼是無監督學習。吳恩達的課程裡沒有貓狗問題的舉例,這個是我覺得比較好理解的,所以把這個問題也加進來了

給電腦一堆貓狗的**,讓他能區分開來這兩類,「區分」在這裡的含義僅僅是電腦能知道有a、b兩類**,但不知道a類**代表貓,b類**代表狗。然後電腦有這個「區分」能力之後,再給他一張貓或者狗的**,讓他識別出來這個**是屬於a類還是b類。

在這個問題中電腦並不知道某張**的正確答案是什麼,它只知道這些**能分成不同的組,在電腦執行一段時間後,他才知道這些**能分成兩組。這就是無監督學習,即沒有標準答案的學習

給你一組基因序列,這些基因序列可能某乙個或某幾個地方共同影響人的乙個性狀。但是目前人類不知道有哪些性狀,以及哪些基因序列會影響某些特定的性狀,這時就要設計乙個「聚類演算法」,把表達出不同性狀的乙個或者一些基因聚成類。

在這個問題中,不僅電腦不知道正確答案,甚至人類都不知道正確答案是什麼,最後的結果能分成幾組(至少在貓狗問題中,我們還可以預料到最後的結果是兩組)。雖然電腦不知道最後會分成幾組,但它也會根據你給他設計的聚類演算法,把這些基因分成特定的一些組別。這也是無監督學習。

吳恩達機器學習筆記之無監督學習

和監督學習相比,無監督學習的資料集是沒有標籤的。所謂沒有標籤的意識就是我們對資料一無所知,但是要借助一些演算法試著幫我們尋找到資料的某些結構特性。聚類 clustering 演算法是我們要學習的第乙個無監督學習的演算法,將我們的資料分成不同的簇。假設我們有下圖所示的資料集 k means演算法是乙個...

機器學習筆記 監督學習,無監督學習,半監督學習

這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。什麼是學習 learning 學習 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必做過,但在高中三年我們做過很多很多題目,懂...

機器學習筆記 監督學習 無監督學習分類筆記

無監督學習 給出一資料組,並已知曉這組資料的對應關係,然後給出一組新的資料,嘗試對其進行 和分析,這裡注意,提前給出的資料組 data set 是已知內部的資料的對應關係,後面給出的新的資料,是要依據對之前資料的學習後,給出新的資料對應的 值。而對於 的結果的不同,又將監督學習分為分類 classf...