機器學習主要解決的是兩類問題,監督學習和無監督學習。
掌握機器學習,主要就是學習、掌握解決這兩類問題的基本思路。
1.什麼是監督學習?
監督學習是指這麼乙個過程,通過外部的響應變數來指導模型學習我們關心的任務,並達到我們需要的目的。也就是說,監督學習的最終目標,是使模型可以更準確地對我們所需要的響應變數建模。例:我們希望可以通過一系列特徵值來**某個地區的房屋銷售**,希望**電影的票房。這裡的「銷售**」、「電影票房」就是監督學習中的響應變數。
換個說法,從給定已經標註了的資料集中學習訓練出乙個模型,當新的未標註的資料輸入時,可以根據訓練好的模型得到**結果。監督學習常用於處理「分類」問題。
2.監督學習的基礎
監督學習的三類模型:
掌握這三類模型就掌握了監督學習的主幹。利用監督學習來解決問題,佔所有機器學習或人工智慧任務的絕大多數,這裡面有90%以上的監督學習問題都可用這三類模型得到比較好的解決。
這三類監督學習模型又可以細分為處理兩類問題:
分類問題的核心是如何利用模型來判別乙個資料點的類別。這個類別一般是離散的,比如兩類或者多類。回歸問題的核心則是利用模型來輸出乙個**的數值。這個數值一般是乙個實數,是連續的。
ps:線性回歸模型(linear regression)是所有回歸模型中最簡單也是最核心的乙個模型。
1.什麼是無監督學習?
通常情況下,無監督學習並沒有明顯的響應變數。無監督學習的核心,往往是希望發現資料內部潛在的結構和規律,為我們進行下一步決斷提供參考。典型的無監督學習就是希望能夠利用資料特徵來把資料分組,也就是「聚類」。
通常情況下,無監督學習能夠挖掘出資料內部的結構,而這些結構可能會比我們提供的資料特徵更能抓住資料的本質聯絡。因此,監督學習中往往也需要無監督學習來進行輔助。
2.無監督學習的基礎
無監督學習的主要目的就是挖掘出資料內在的聯絡。這裡的根本問題是,不同的無監督學習方法對資料內部的結構有不同的假設。因此,無監督學習不同模型之間常常有很大的差別。在眾多無監督學習模型中,聚類模型無疑是重要的代表。了解和熟悉聚類模型有助於我們了解資料的一些基本資訊。
ps:k 均值演算法(k-means)是聚類演算法模型中最常見的、非常重要的演算法模型。
有監督學習和無監督學習 無監督學習
一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...
監督學習,無監督學習和半監督學習
監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...
監督學習和無監督學習
機器學習要解決的第一類問題是分類問題。機器學習的另一項任務是回歸,它主要用於 數值型資料。大多數人可能都見過回歸的例子 資料擬合曲線 通過給定資料點的最優擬合曲線。分類和回歸都屬於監督學習,之所以稱之為監督學習,是因為這類演算法必須知道 什麼,即目標變數的分類資訊。與監督學習對應的是無監督學習,此時...