吳恩達機器學習 第1周 監督學習與無監督學習

2021-09-30 18:15:00 字數 988 閱讀 1805

自學的教程

trace_c_p_k2=9039884a4c1f40ab98eb7fe5b0cf6e78

吳恩達老師的機器學習課程個人筆記:

基本思想是,資料集中的每個樣本都有「正確答案」。再根據這些樣本做出**。

可以將監督學習粗略的劃分為兩類:

1)回歸問題:通過回歸來推出乙個連續的輸出(典型例子:**某一年的房價),回歸就指的是根據之前的資料**出乙個準確的輸出值。

2)分類問題:目標是推出一組離散的結果(典型例子:**腫瘤是良性或惡性),根據之前的資料**離散的輸出值。

假設你經營著一家公司,你想開發學習演算法來處理這兩個問題:

你有一大批同樣的貨物,想象一下,你有上千件一模一樣的貨物等待**,這時你

想**接下來的三個月能賣多少件?

你有許多客戶,這時你想寫乙個軟體來檢驗每乙個使用者的賬戶。對於每乙個賬戶,

你要判斷它們是否曾經被盜過?

問題一是乙個回歸問題,因為你知道,如果我有數千件貨物,我會把它看成乙個實數,乙個連續的值。因此賣出的物品數,也是乙個連續的值。

問題二是乙個分類問題,因為我會把**的值,用 0 來表示賬戶未被盜,用 1 表示賬戶曾經被盜過。所以我們根據賬號是否被盜過,把它們定為 0 或 1,然後用演算法推測乙個賬號是 0 還是 1,因為只有少數的離散值,所以我把它歸為分類問題。

無監督學習資料集的特點是,沒有明確的相同的標籤,所以我們的資料集就只是純粹的資料集,而不知道每個資料點表示什麼含義,不像監督學習,都有「正確答案」。

無監督學習,主要有兩個大類:

1)聚類:

針對資料集,無監督學習就能判斷出資料有兩個不同的聚集簇。無監督學習演算法可能會把這些資料分成兩個不同的簇,所以叫做聚類演算法。聚類演算法的應用十分廣泛。比如社交網路的分析,通過某些特徵對朋友進行分類;分析天文資料等等,諸多方面。

2)雞尾酒宴問題

酒會上很多人,有的人離麥克風近,有的離得遠。所以大家都在說話的時候傳到麥克風中的聲音不同。比如兩個聲音的疊加,無監督學習,可以將兩個聲音分離出來。

吳恩達機器學習筆記(1) 監督學習和無監督學習

在監督學習中,我們會有一組已經知道輸出結果應該是怎麼樣的資料集,也就是說,知道輸入和輸出之間會有一種特定的關係。然後,在監督學習中問題又被分成 回歸 和 分類 兩類問題。回歸 regression 的是一組連續的輸出結果,也就是說需要將輸入的資料與某個特定的連續函式所對應起來。分類 classifi...

吳恩達機器學習筆記 監督學習和無監督學習

1.監督學習 通過給定的資料集,進行 得到 正確的答案 並且資料集已經包括了答案。如 100平的房價100w,120平的房價120w,140平的房價140w,通過學習,我們可以 150平的房價150w左右。1.1回歸和分類 回歸指我們的 值應該是個連續輸出值 real valued output 如...

吳恩達機器學習筆記之無監督學習

和監督學習相比,無監督學習的資料集是沒有標籤的。所謂沒有標籤的意識就是我們對資料一無所知,但是要借助一些演算法試著幫我們尋找到資料的某些結構特性。聚類 clustering 演算法是我們要學習的第乙個無監督學習的演算法,將我們的資料分成不同的簇。假設我們有下圖所示的資料集 k means演算法是乙個...