2023年deepmind 在nips上發表playing atari with deep reinforcement learning 一文,提出了dqn(deep q network)演算法,實現端到端學習玩atari遊戲,即只有畫素輸入,看著螢幕玩遊戲。deep mind就憑藉這個應用以6億美元被google收購。由於dqn的開源,在github上湧現了大量各種版本的dqn程式。這裡實現一種用caffe實現的版本,詳細描述一下環境配置和執行過程。
dqn-in-the-caffe
caffe
ale最新的是0.5.1版本,但是一直有問題,建議使用0.4.4版本,ale安裝教程和使用教程在安裝包裡面manual.pdf。
安裝sdl 按照manual.pdf
$path/ale_0.4.4/ale_0_4$ cp makefile.unix makefile
開啟sdl
use_sdl := 1
$path/ale_0.4.4/ale_0_4$ make
make allmake test
make runtest
make distribute
caffe的環境配置這裡不做介紹
protoc src/caffe/proto/caffe.proto –cpp_out=.
mkdir include/caffe/proto
mv src/caffe/proto/caffe.pb.h include/caffe/proto
pythonpath=」/home/ajay/pylearn2:/home/ajay/pylearn2/pylearn2/scripts:/usr/local/caffe/python/caffe:$pythonpath」
export pythonpath
修改cmake配置
option(cpu_only "use cpu only for caffe" off)
option(use_cudnn "use cudnn for caffe" off)
option(use_sdl "use sdl for ale" on)
include_directories(your_path/caffe-dqn/include)
include_directories(/usr/local/cuda-7.0/include)
include_directories(your_path/ale_0.4.4/ale_0_4/src)
link_directories(your_path/caffe-dqn/build/lib)
link_directories(your_path/ale_0.4.4/ale_0_4)
mkdir build
cd build
cmake ..
make
如果成功會顯示if everything works the last two lines will be
linking cxx executable dqn
[100%] built target dqn
接下來需要找乙個遊戲檔案breakout.bin
將breakout.bin,dqn_solver.prototxt,dqn.prototxt放在build下
your_path/dqn-in-the-caffe-master/build$ ./dqn
如果用gpu就將其開啟
option(cpu_only 「use cpu only for caffe」 on)
cmake ..
make
./dqn -gpu
訓練好後測試
dqn推薦系統 基於強化學習DQN的智慧型體信任增強
基於強化學習 dqn的智慧型體信任增強 亓法欣童向榮 於雷 期刊名稱 計算機研究與發展 年卷 期 2020 057 006 摘要 信任推薦系統是以社交網路為基礎的一種重要推薦系統應用 其結合用 戶之間的信任關係對使用者進行專案推薦 但之前的研究一般假定使用者之間的信任 值固定無法對使用者信任及偏好的...
人臉識別 基於Caffe
0 jpg 0 修改部分 example home jh face detect data home jh face detect tools caffe安裝目錄 build tools train data root home jh face detect train val data root ...
Caffe實踐 基於Caffe的人臉識別實現
深度學習深似海 尤其是在影象人臉識別領域,最近幾年的頂會和頂刊常常會出現沒有太多的理論創新的文章,但是效果擺在那邊。deepid是深度學習方法進行人臉識別中的乙個簡單,卻高效的乙個網路模型,其結構的特點可以概括為兩句話 1 訓練乙個多個人臉的分類器,當訓練好之後,就可以把待測試影象放入網路中進行提取...