無監督學習和強化學習機器學習

2021-09-06 23:57:31 字數 687 閱讀 1010

在此學習方式下,輸入資料部分被標識,部分沒有被標識,這樣的學習模型能夠用來進行預測,可是模型首先須要學習資料的內在結構以便合理的組織資料來進行預測。應用場景包含分類和回歸。演算法包含一些對經常使用監督式學習演算法的延伸。這些演算法首先試圖對未標識資料進行建模,在此基礎上再對標識的資料進行預測。

如圖論推理演算法(graph inference)或者拉普拉斯支援向量機(laplacian svm.)等。

強化學習

在這樣的學習模式下,輸入資料作為對模型的反饋。不像監督模型那樣,輸入資料不過作為乙個檢查模型對錯的方式,在強化學習下,輸入資料直接反饋到模型,模型必須對此立馬作出調整。常見的應用場景包含動態系統以及機械人控制等。

常見演算法包含q-learning以及時間差學習(temporal difference learning)。

在企業資料應用的場景下。 人們最經常使用的可能就是監督式學習和非監督學習模式。

在諸如影象識別區域。因為有很多非識別資料和少量的資料的可識別。 現在半監督學習是乙個非常熱門的話題。 強化學習,和其他領域的需要在許多其他的機械人控制系統控制應用。

監督學習 無監督學習 強化學習

學習的種類分為監督學習 無監督學習 強化學習等,我們將學生比作計算機,老師比作周圍的環境 資料 監督學習 對於有標籤的資料進行學習,目的是能夠正確判斷無標籤的資料。通俗的講,老師教授學生知識,並告知學習過程中的對與錯,讓學生可以從所學知識的經驗和技能中對沒有學過的問題進行正確回答,這就是監督學習,用...

監督學習 無監督學習 半監督學習 強化學習

目錄 監督學習 非監督學習 半監督學習 強化學習 懶散學習法 積極學習法 1 訓練資料有標柱類別 2 指根據訓練資料學習乙個模型,然後能對後來的輸入做 3 輸入變數和輸出變數可以是連續的,也可以是離散的。若輸入變數和輸出變數均為連續變數,則稱為回歸 輸出變數為有限個離散變數,則稱為分類。4 必須要有...

監督學習 無監督學習 強化學習的區別

目前機器學習主流分為三大類 監督學習,無監督學習和強化學習 舉個例子,我們經常考試,試卷上的題目我們未必都做過,但是在複試的時候會刷很多題,通過這些題目我們學會了階梯方法,在考試時面對陌生的題目也能做出來。同樣機器學習也是乙個舉一反三的過程,我們可以利用一些訓練資料,使機器能夠利用它們分析未知資料。...