Docker中構建深度學習環境

2021-10-09 19:53:42 字數 2057 閱讀 5092

1.安裝nvidia-docker

$ distribution=$(. /etc/os-release;echo $id$version_id)

$ curl -s -l | sudo apt-key add -

$ curl -s -l | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

$ sudo apt-get update && sudo apt-get install -y nvidia-docker2

$ sudo systemctl restart docker

2.拉去所需pytorch docker映象比如我拉取的是:pytorch/pytorch:1.3-cuda10.1-cudnn7-devel,則執行

$ sudo docker pull pytorch/pytorch:1.3-cuda10.1-cudnn7-devel
檢視安裝的映象:

$ sudo docker images
如下圖所示 pytorch/pytorch:1.3-cuda10.1-cudnn7-devel就是我們拉取的映象

3.啟動容器

$ sudo docker run --name fastreid --gpus all -it -v $pwd:/home pytorch/pytorch:1.3-cuda10.1-cudnn7-devel bash
--name:代表容器名稱,自行確定,如果沒有指定,會隨機生成;

--gpus:指定使用的gpu數量,這裡為所有all,一定要設定該引數,否則無法呼叫gpu;

-it:使用互動式interactive;

-v:磁碟掛載,$pwd:/home的意思是將當前路徑掛載到容器/home目錄下,這樣進入容器之後cd/home,就可以執行當前路徑下的檔案了;

pytorch/pytorch:1.3-cuda10.1-cudnn7-devel:表示docker映象

-bash:最後一項表示執行容器的命令,在互動模式下執行bash,就可以進入容器的bash了

4.停止容器

$ sudo docker stop fastreid
fastreid就是之前建立容器時賦予的名字

5.檢視容器

$ sudo docker ps
6.也可以使用下面的命令(使用容易的id)停止容器

$ sudo docker stop a25296453d73
7.檢視所有容器,包括已經停止的容器

$ sudo docker ps -a
8.刪除容器一定要慎重,不然在容器中安裝的環境就沒了,又得重新安裝

$ sudo docker rm fastreid

$ sudo docker rm a25296453d73

9.刪除映象

$ sudo docker image rm $
可以刪除映象,如果提示有容器在占用,需要先刪除容器,再刪除映象,這裡的$就是映象的i

docker 配置深度學習環境

以配置pytorch為例 step 2 配置所跑 需要的環境 採用pip pip install i trusted host pypi.douban.com mmcv opencv python scipy tb nightly networkx scikit image matplotlib f...

使用docker建立深度學習環境

新裝的伺服器版本為ubuntu18.04.3,裝的cuda版本10.2,發現tf現在並不支援,tf對於cuda支援比較嚴格具體可以檢視 tf支援的cuda版本 cuda的作業系統要求 所以通過docker,省去更換系統的麻煩。docker部署深度學習環境,是不需要宿主機安裝cuda的,只需要宿主機安...

docker部署深度學習cpu環境

1.使用 阿里雲 映象站點加速服務 在安裝 docker 後,理論上我們就可以去 docker hub 上尋找我們想用的映象了。不過在國內訪問國外的 docker hub 速度是非常慢的訪問 2.選擇 docker 映象加速器。curl fssl bash s docker mirror aliyu...