深度增強學習前沿演算法思想

2023年 alphago 計算機圍棋系**勝頂尖職業棋手李世石，引起了全世界的廣泛關注，人工智慧進一步被推到了風口浪尖。而其中的深度增強學習演算法是 alphago 的核心，也是通用人工智慧的實現關鍵。本文將帶領大家了解深度增強學習的前沿演算法思想，領略人工智慧的核心奧秘。

前言深度增強學習與通用人工智慧

當前深度學習已經在計算機視覺、語音識別、自然語言理解等領域取得了突破，相關技術也已經逐漸成熟並落地進入到我們的生活當中。然而，這些領域研究的問題都只是為了讓計算機能夠感知和理解這個世界。以此同時，決策控制才是人工智慧領域要解決的核心問題。計算機視覺等感知問題要求輸入感知資訊到計算機，計算機能夠理解，而決策控制問題則要求計算機能夠根據感知資訊進行判斷思考，輸出正確的行為。要使計算機能夠很好地決策控制，要求計算機具備一定的「思考」能力，使計算機能夠通過學習來掌握解決各種問題的能力，