自學的教程
trace_c_p_k2=9039884a4c1f40ab98eb7fe5b0cf6e78
吳恩達老師的機器學習課程個人筆記:
基本思想是,資料集中的每個樣本都有「正確答案」。再根據這些樣本做出**。
可以將監督學習粗略的劃分為兩類:
1)回歸問題:通過回歸來推出乙個連續的輸出(典型例子:**某一年的房價),回歸就指的是根據之前的資料**出乙個準確的輸出值。
2)分類問題:目標是推出一組離散的結果(典型例子:**腫瘤是良性或惡性),根據之前的資料**離散的輸出值。
假設你經營著一家公司,你想開發學習演算法來處理這兩個問題:
你有一大批同樣的貨物,想象一下,你有上千件一模一樣的貨物等待**,這時你
想**接下來的三個月能賣多少件?
你有許多客戶,這時你想寫乙個軟體來檢驗每乙個使用者的賬戶。對於每乙個賬戶,
你要判斷它們是否曾經被盜過?
問題一是乙個回歸問題,因為你知道,如果我有數千件貨物,我會把它看成乙個實數,乙個連續的值。因此賣出的物品數,也是乙個連續的值。
問題二是乙個分類問題,因為我會把**的值,用 0 來表示賬戶未被盜,用 1 表示賬戶曾經被盜過。所以我們根據賬號是否被盜過,把它們定為 0 或 1,然後用演算法推測乙個賬號是 0 還是 1,因為只有少數的離散值,所以我把它歸為分類問題。
無監督學習資料集的特點是,沒有明確的相同的標籤,所以我們的資料集就只是純粹的資料集,而不知道每個資料點表示什麼含義,不像監督學習,都有「正確答案」。
無監督學習,主要有兩個大類:
1)聚類:
針對資料集,無監督學習就能判斷出資料有兩個不同的聚集簇。無監督學習演算法可能會把這些資料分成兩個不同的簇,所以叫做聚類演算法。聚類演算法的應用十分廣泛。比如社交網路的分析,通過某些特徵對朋友進行分類;分析天文資料等等,諸多方面。
2)雞尾酒宴問題
酒會上很多人,有的人離麥克風近,有的離得遠。所以大家都在說話的時候傳到麥克風中的聲音不同。比如兩個聲音的疊加,無監督學習,可以將兩個聲音分離出來。
吳恩達機器學習筆記(1) 監督學習和無監督學習
在監督學習中,我們會有一組已經知道輸出結果應該是怎麼樣的資料集,也就是說,知道輸入和輸出之間會有一種特定的關係。然後,在監督學習中問題又被分成 回歸 和 分類 兩類問題。回歸 regression 的是一組連續的輸出結果,也就是說需要將輸入的資料與某個特定的連續函式所對應起來。分類 classifi...
吳恩達機器學習筆記 監督學習和無監督學習
1.監督學習 通過給定的資料集,進行 得到 正確的答案 並且資料集已經包括了答案。如 100平的房價100w,120平的房價120w,140平的房價140w,通過學習,我們可以 150平的房價150w左右。1.1回歸和分類 回歸指我們的 值應該是個連續輸出值 real valued output 如...
吳恩達機器學習筆記之無監督學習
和監督學習相比,無監督學習的資料集是沒有標籤的。所謂沒有標籤的意識就是我們對資料一無所知,但是要借助一些演算法試著幫我們尋找到資料的某些結構特性。聚類 clustering 演算法是我們要學習的第乙個無監督學習的演算法,將我們的資料分成不同的簇。假設我們有下圖所示的資料集 k means演算法是乙個...