tensorflow深度學習伺服器環境搭建

2021-09-02 11:01:38 字數 2182 閱讀 8253

實驗室新進了一台伺服器,配置了nvida 1080ti顯示卡做深度學習使用,裝好機器後第一件事就是如何配置好tensorflow的深度學習環境,這裡把我在搭建環境的過程以及遇到的坑一一寫下來,給有同樣需求的筒子提供一些幫助。

作業系統是師兄刻好的ubuntu最新版本ubuntu 18.04.1 lts (可使用lsb_release -v檢視),這種事當然第一件事就是谷歌了,發現一條接下來就是按照提示一步一步進行就是了。

搭建過程一共分為5步

安裝 anaconda & python(ubuntu自帶python3)

更新 anaconda

安裝 cuda & cudnn(cudnn不需要自己裝)

安裝tensorflow & keras

cuda版本切換(如果正常裝好不需要)

1,2,3步都是常規且比較簡單就可以完成的事情,這裡就簡單說一下了,

bash anaconda3-5.3.1-linux-x86_64.sh
跟著提示就可以順利安裝了安裝了,如果你向我一樣使用zsh作為預設shell的話,所以需要將.bashrc下的anaconda安裝時自動新增的以下**

複製進.zshrc檔案末尾,source ~/.zshrc完成呼叫,終端輸入conda看到幫助說明裝好了

在終端輸入以下命名更新conda

conda update conda

conda update --all

下好之後就簡單了

sudo dpkg -i cuda-repo-ubuntu1704-9-0-local_9.0.176-1_amd64-deb

sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub

sudo

apt-get update

sudo

apt-get

install cuda

cudnn並不需要安裝,在下一步安裝tensorflow的時候,anaconda會自動安裝cudnn,

直接使用anaconda安裝就可以了

conda install -c anaconda tensorflow-gpu

conda install -c conda-forge keras-gpu

通過使用python -c "import tensorflow as tf;"檢視tensorflow環境是否建好,

提示錯誤

搜尋後發現是cuda的問題,使用ldconfig -v可以看到找不到libcublas.so.9.0,這是cuda9.0裡面的,而我一開始安裝的是最新版的cuda10,所以這裡被坑了一波。。。

那麼就需要解除安裝cuda10了

sudo

apt-get remove cuda*

sudo apt remove --purge nvidia*

rm /etc/apt/sources.list.d/cuda-10-0-local-10.0.130-410.48.list

sudo apt autoremove

sudo

rm -rf /var/cuda-repo-10-0-local-10.0.130-410.48

sudo

rm -rf /usr/local/cuda*

都跑一遍再來重新安裝應該就好了,這裡再次使用python -c "import tensorflow as tf;"命令就可以發現沒有報錯了。

總結一下:本文介紹了搭建tensorflow深度學習環境的過程,從anaconda安裝到cuda,tensorflow-gpu的安裝以及遇到的最大的坑,就是cuda官網上預設是最新版的cuda10,而由於tensorflow gpu版本目前並不支援cuda10,只識別cuda9.0,在沒有安裝cuda9的機器上使用會直接報錯,不得不重新解除安裝cuda10,安裝cuda9,安裝好後tensorflow就可以正常使用了。

TensorFlow 深度學習筆記

google 深度學習筆記 經常總結是個好習慣,筆記目錄奉上。歡迎star,有問題可以到issue區討論 官方教程位址 最近tensorflow團隊出了乙個model專案,和這個課程無關,但是可以參考 框架 tensorflow 谷歌出品的基於python的深度學習工具集 工具 ipython,py...

TensorFlow深度學習框架

tensorflow支援python和c 兩種程式語言,再複雜的多層神經網路模型都可以用python來實現,如果業務使用其他程式設計也不用擔心,使用跨語言的grpc或者http服務也可以訪問使用tensorflow訓練好的智慧型模型。tensorflow 是乙個採用資料流圖 data flow gr...

深度學習 初識TensorFlow

深度學習使用場景 影象理解 語音識別 自然語言處理 機器自主 無人駕駛 深度學習,如深度神經網路 卷積神經網路和遞迴神經網路已被應用計算機視覺 語音識別 自然語言處理 音訊識別與生物資訊學等領域並取得了很好的效果。深度學習在人工智慧領域的地位 深度學習框架 google brain計畫產物 應用於a...