什麼是深度學習 強化學習

2021-10-24 14:21:48 字數 935 閱讀 9000

今天在學習過程中碰到乙個自己不懂的常識:reinforcement learing(強化學習)

之前在入門機器學習過程中單純的知道只有深度學習,今天看**的時候發現還存在強化學習,所以今天就乾脆將深度學習與強化學習兩者是啥以及二者的區別是什麼記錄在這裡。

1.深度學習

深度學習本質上是乙個自主的、自學的系統,您可以使用現有的資料來訓練演算法來發現模式,然後使用這些模式來**新的資料。 例如,你可以訓練乙個深度學習演算法來識別**上的貓。你可以通過給它輸入數以百萬計的影象來達到這個目的,這些影象要麼包含貓,要麼不包含貓。然後,該程式將通過對影象資料(例如,邊緣、形狀、顏色、形狀之間的距離等)進行分類和聚類來建立模式。這些模式將形成乙個**模型,該**模型能夠檢視一組新影象並**影象中是否包含貓。

深度學習演算法通過類似人的大腦中神經元網路的人工神經網路來實現這一點。 這允許演算法執行各種迴圈以縮小模式並改進每個迴圈的**結果。

2.強化學習

強化學習也是一種自主性、自學習的學習系統,本質上是一種反覆嘗試的學習。

強化學習是一類演算法, 是讓計算機實現從一開始什麼都不懂, 腦袋裡沒有一點想法, 通過不斷地嘗試, 從錯誤中學習, 最後找到規律, 學會了達到目的的方法. 這就是乙個完整的強化學習過程.

實際中的強化學習例子有很多, 比如近期最有名的 alpha go, 機器頭一次在圍棋場上戰勝人類高手, 讓計算機自己學著玩經典遊戲 atari, 這些都是讓計算機在不斷的嘗試中更新自己的行為準則, 從而一步步學會如何下好圍棋, 如何操控遊戲得到高分. 

3.二者的區別

深度學習和強化學習都是自主學習的系統。 它們之間的區別在於,深度學習是從乙個訓練集學習,然後將該學習應用到乙個新的資料集,而強化學習是通過在連續反饋的基礎上調整動作來動態學習,以最大化回報。

深度學習和強化學習並不是相互排斥的。 事實上,你可以在強化學習系統中使用深度學習,這被稱為深度強化學習。

強化學習1 什麼是強化學習

強化學習 reinforcement learning,rl 一般也稱作增強學習,和心理學 動物行為的研究等領域有比較久的淵源。心理學中,強化 指生物受到外界環境中的某些刺激後,自覺或者不自覺調整應對策略,達到趨利避害。舉個例子。馬戲團訓練動物時 比方說猴子 訓導員首先會發出某種指令 比方說抬一下手...

初識強化學習,什麼是強化學習?

相信很多人都聽過 機器學習 和 深度學習 但是聽過 強化學習 的人可能沒有那麼多,那麼,什麼是強化學習呢?強化學習是機器學習的乙個子領域,它可以隨著時間的推移自動學習到最優的策略。在我們不斷變化的紛繁複雜的世界裡,從更廣的角度來看,即使是單純的靜態的輸入 輸出型問題也會變成動態的問題。例如,對於乙個...

深度強化學習

這是寫給自己看的,大佬請忽略 深度學習和其他機器學習演算法最大的不同在於如何找到特徵,而特徵的抽取過程就是乙個抽象的全過程。以往機器學習演算法的特徵抽取都是對一類問題有解,比如k means等聚類。深度學習抽象模擬了人類神經元傳遞和連線方式,理論上可以解決多種分類問題和 問題,甚至研究未知領域。深度...