兩者應用在模式識別的領域,目的是對給定的樣本進行劃分。
有監督學習將樣本分為訓練集和測試集,訓練集中的資料帶有標籤,標誌著這些樣本來自哪些類別,訓練集中的資料沒有標籤。有監督學習的目的就是學習訓練集中不同類別資料的特徵,得到乙個能把不同類別資料劃分開來的模式,然後在測試集中應用這個模式來**未知類別的樣本。
無監督學習中,樣本都沒有類別標籤。它的劃分方式是根據樣本與樣本之間的相似度來決定的。
二者的區別:有監督學習的目的是為了識別樣本,他的衡量標準是給待識別樣本賦予的標籤的準確與否;而無監督學習的目的只是為了發現資料集的某種聚集規律。
引數估計是假設某個研究的問題服從某個分布,這個分布中有一些確定的引數,然後用樣本的統計量來估計總體的引數。
而非引數估計是知道乙個問題是有引數的,但是引數可能是無限個,只能得到密度可能連續、期望值存在之類的一般性假設。
那麼,兩種學習方式的演算法和引數估計、非引數估計的連續是什麼呢?
有監督學習和無監督學習 無監督學習
一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...
有監督學習 無監督學習與半監督學習
這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。但根據知乎慣例,答案還是要繼續擴充套件的。首先看什麼是學習 learning 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必...