在機器學習的領域,有兩類主要的任務:監督學習與無監督學習。這兩種方法上的區別在於,監督學習是使用真實的標籤來完成的,但是在無監督中,卻不存在這樣的標籤。因為這樣的特性,監督學習的目標是學習乙個函式,在已知該樣本資料與輸出值的情況下,盡最大的可能去擬合輸入與輸出的關係,無監督學習一般是推斷一組資料的內部結構.
監督學習中有兩大主要的任務,即分類任務與回歸任務.
下圖形象的展示了什麼是分類,什麼是回歸問題
進行監督學習時,有的一些問題需要綜合考慮模型複雜度。
模型的複雜程度取決於訓練資料的性質,這時需要根據具體問題具體的分析,比如我們需要在兩個點之間擬合一條曲線,從理論上來說,我們可以使用任意的複雜的函式曲線進行擬合,但是這樣往往會導致過擬合,因為一般的情況下,我們僅僅會考慮一條直線來擬合兩個點之間的直線。
無監督學習
無監督學習最常見的就是聚類任務、表示學習、密度估計。在這些任務中,我們希望不提供任何的標籤的情況下,了解資料的內在結構。最常用的就是聚類,由於沒有提供標籤,因此大多數無監督的學習方法中沒有具體的方法去比較模型之間的效能.
無監督學習的兩種常見的用法是探索性分析與降維.
無監督學習在探索性分析的任務中很有用,我曾經在資料探勘中,就用到了關於無監督的聚類的問題,其問題的背景就是根據**在某乙個區域的流動範圍,讓我們去估計這乙個地帶的特徵,當時記得用到的就是無監督學習中的層次聚類,因為資料是非常多的,並且有時候收集到的資料有不同的屬性,因此單憑我們去分析,很難能夠發現資料之間的聯絡,但是如果我們使用聚類的演算法思想,我們就可在資料趨勢不明朗的情況下,具體的將我們的資料分為幾個不同的型別,為我們進一步的分析作為指引,(因為在有的資料探勘實現中,我們需要提前知道該樣本的具體分成了幾個類別,將我們的類別數目作為引數傳入到我們的函式中,因此需要聚類的方式先對資料進行分析)
降維指的是使用比較少的特徵表示資料的一種方式,這一問題可以使用無監督的方法來完成,在表示學習中,我們希望了解各個特徵間的關係,使得我們可以用初始特徵間的潛在特徵來表示資料,這種稀疏的潛在特徵通常比原始特徵的維度要低,因此可以使資料特徵變得更加稠密,並且可以消除冗餘.(說了這麼多廢話,主要就是當我們要降維時,要考慮到利用無監督的學習方式去操作)
無監督學習與監督學習
1.無監督和有監督的理解方法有很多,主要可以從以下幾方面來理解 1 無監督與監督學習的區別在於乙個無教學值,乙個有教學值。但是,個人認為他們的區別在於無監督學習一般是採用聚簇等演算法來分類不同樣本。而監督學習一般是利用教學值與實際輸出值產生的誤差,進行誤差反向傳播修改權值來完成網路修正的。但是無監督...
監督學習與無監督學習
監督學習 監督學習是指我們給演算法乙個資料集,其中包含了正確答案。也就是說我們給它乙個房價資料集,在這個資料集中的每個樣本,我們都給出正確的 即這個房子實際賣價,演算法的目的就是給出更多的正確答案,輸入和輸出都是有參照的,根據參照,給定乙個新的輸入,新的輸出。如房價 給定某地房子大小和房價的資料,根...
無監督學習與監督學習
無監督學習與監督學習 1 首先我們要知道什麼是機器學習 a 從我們的學習推導而來 舉個例子 要考試了,老師給我們刷題,然後我們通過完成老師給的題目,考試考了100分,考試題不是原題,但與原題十分相似 b 我們總結一下 要考試了,老師給我們刷題 訓練集 然後我們通過完成老師給的題目 訓練 考試 要處理...