資料監督與非監督

2022-03-11 12:02:39 字數 1824 閱讀 3071

資料分析的基礎知識內容

什麼是監督學習

在監督學習中,計算機通過示例學習。它從過去的資料中學習,並將學習的結果應用到當前的資料中,以**未來的事件。在這種情況下,輸入和期望的輸出資料都有助於**未來事件

二:所有監督學習演算法本質上都是複雜演算法,分為分類或回歸模型。

1.回歸模型—回歸模型用於輸出變數為實際值的問題,

例如單一的數字、美元、薪水、體重或壓力。它最常用於根據先前的觀測資料來**數值。

一些比較常見的回歸演算法包括線性回歸、邏輯回歸、多項式回歸和脊回歸。

2.分類模型—分類模型用於可以對輸出變數進行分類,

例如「是」或「否」、「通過」或「失敗」。分類模型用於**資料的類別。

現實生活中的例子包括垃圾郵件檢測、情緒分析、考試記分卡**等。

無監督學習是訓練機器使用既未分類也未標記的資料的方法。

這意味著無法提供訓練資料,機器只能自行學習。機器必須能夠對資料進行分類,而無需事先提供任何有關資料的資訊。

其理念是先讓計算機與大量變化的資料接觸,並允許它從這些資料中學習,以提供以前未知的見解,

並識別隱藏的模式。

因此,無監督學習演算法不一定有明確的結果。相反,它確定了與給定資料集不同或有趣之處。

計算機需要程式設計才能自學。計算機需要從結構化和非結構化資料中理解和提供見解。

無監督學習的準確說明

無監督機器學習分類

1.聚類是最常見的無監督學習方法之一。聚類的方法包括將未標記的資料組織成類似的組,稱為聚類。因此,聚類是相似資料項的集合。此處的主要目標是發現資料點中的相似性,並將相似的資料點分組到乙個聚類中。

2.異常檢測是識別與大多數資料顯著不同的特殊項、事件或觀測值的方法。通常在資料中尋找異常或異常值的原因在於它們是可疑的。異常檢測常用於銀行欺詐和醫療差錯檢測。

簡單一句話就是

監督(supervised)=標籤(label),是否有監督,就是輸入資料(input)是否有標籤,有標籤 則為有監督學習,沒標籤則為無監督學習。至於半監督學習,就是一半(一點點)資料有標籤,一 半(極其巨大)資料沒標籤。

例如學數學,小學老師會先給大量訓練,讓人學會解題方法。之後面對考試的時候出現的絕對不同 的題目,也能回答。

a) 監督學習是最常見的一種機器學。

它的訓練資料是有標籤的,訓練目標是能夠給新資料(測試 資料)以正確的標籤。 例如,想讓ai知道什麼是貓什麼是狗,一開始我們先將一些貓的和狗的(帶標籤)一起進 行訓練,學習模型不斷捕捉這些與標籤間的聯絡進行自我調整和完善,然後我們給一些不帶標 籤的新,讓該ai來猜猜這些是貓還是狗。 經典的演算法:支援向量機、線性判別、決策樹、樸素貝葉斯

b) 無監督學習常常被用於資料探勘。

用於在大量無標籤資料中發現些什麼。它的訓練資料是無標籤 的,訓練目標是能對觀察值進行分類或者區分等。相對於監督學習,無監督學習使用的是沒有標籤 的資料。機器會主動學習資料的特徵,並將它們分為若干類別,相當於形成「未知的標籤」。 非監督性學習是只給特徵,沒有給標籤,就是高考前的一些模擬試卷,是沒有標準答案的,也就是 沒有參照是對還是錯,但是我們還是可以根據這些問

題之間的聯絡將語文、數學、英語分開。

--參考知乎

--參考西瓜書機器學習

--參考csdn 部分資料

基本概念 監督與非監督

監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...

監督學習和無監督學習 監督學習與非監督學習

監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...

有監督與無監督

機器學習分為 監督學習,無監督學習,半監督學習 也可以用hinton所說的強化學習 等。簡單的歸納就是,是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習 沒標籤則為無監督學習。有監督和無監督中間包含的一種學習演算法是半監督學習 semi super...