深度學習伺服器裝機問題彙總

2021-10-08 14:40:11 字數 3440 閱讀 7128

問題一、importerror: no module named cv2

解決方案:sudo apt-get install python-opencv

問題二、importerror: no module named _caffe

解決方案:在make all編譯後make pycaffe

問題三、importerror: no module named flask.ext.socketio

解決方案:sudo pip  install --upgrade flask-socketio

問題四、importerror: no module named skfmm

解決方案:sudo pip2 install --upgrade scikit-fmm

問題五、importerror: cannot import name socketio

換成 from flask_socketio import socketio 也一樣

問題六、importerror: no module named werkzeug.test

解決方案:pip install  werkzeug

問題七、importerror: no module named google.protobuf.internal

解決方案:sudo apt-get install python-protobuf

問題八、importerror: no module named skimage.io

解決方案:sudo apt-get install python-matplotlib python-numpy python-pil python-scipy

sudo apt-get install build-essential cython

sudo apt-get install python-skimage

問題九、缺少動態連線庫.so--cannot open shared object file: no such file or directory

ln -s /where/you/install/lib/*.so /usr/lib

sudo ldconfig

問題十、importerror: libopenblas.so.0: cannot open shared object file***

解決方案:安裝openblas 然後將libopenblas.so.0檔案cp到/usr/lib下

問題十一、error while loading shared libraries: libcudart.so.8.0: cannot open shared object file: can not open

解決方案:主要是 /usr/local/lib/目錄下找不到libcudart.so.8.0這個檔案, 該檔案可以在usr/local/cuda-8.0/lib64/目錄下找到,因此我們通過下面的命令將libcudart.so.8.0這個檔案複製乙份過去,記得要加sudo許可權,否則可能無法複製。

在命令列輸入:sudo cp /usr/local/cuda-9.0/lib64/libcudart.so.8.0 /usr/local/lib/libcudart.so.8.0 && sudo ldconfig,

類似的問題都可以這樣解決

sudo cp /usr/local/cuda-9.0/lib64/libcublas.so.9.0 /usr/local/lib/libcublas.so.9.0 && sudo ldconfig 

sudo cp /usr/local/cuda-9.0/lib64/libcurand.so.9.0 /usr/local/lib/libcurand.so.8.0 && sudo ldconfig

sudo cp /usr/local/cuda-9.0/lib64/libcudnn.so.6 /usr/local/lib/libcudnn.so.6 && sudo ldconfig

問題十二、caffe測試mnist時出現錯誤:error while loading shared libraries: libcublas.so.9.0

解決方案:vim /etc/ld.so.conf新增如下

echo "/usr/local/cuda-9.0/lib64"

#ldconfig  

問題十三、can not find "hdf5.h":

解決方案:開啟makefile.config

include_dirs := $(python_include) /usr/local/include   /usr/include/hdf5/serial  

library_dirs := $(python_lib) /usr/local/lib  /usr/lib  /usr/lib/x86_64-linux-gnu/hdf5/serial

問題十四、digits呼叫出現:valueerror: caffe executable not found in path

解決辦法:檢查當前envvar的值,命令:echo $caffe_root

vi  /etc/profile 新增如下:

export caffe_root=/home/bgl/caffe

生效:source /etc/profile

檢查一下,命令echo $caffe_root,可以看到位置資訊。

問題十五、cudnn_deconv_layer.cu:34] check failed: status == cudnn_status_success (8 vs 0)

解決辦法:

問題十六、importerror: no module named google.protobuf.internal

解決辦法: apt-get install python-protobuf

問題十七、httperror:『300』 is not

解決方法: 由於flask版本過高,降低版本即可

問題十七、importerror: no module named flask.ext.wtf

解決方案:sudo apt-get install flask-wtf

編譯pycaffe報錯python/caffe/_caffe.cpp:10:31: fatal error: numpy/arrayobject.h: 沒有那個檔案或目錄

sudo apt-get install python-numpy

tensorflow深度學習伺服器環境搭建

實驗室新進了一台伺服器,配置了nvida 1080ti顯示卡做深度學習使用,裝好機器後第一件事就是如何配置好tensorflow的深度學習環境,這裡把我在搭建環境的過程以及遇到的坑一一寫下來,給有同樣需求的筒子提供一些幫助。作業系統是師兄刻好的ubuntu最新版本ubuntu 18.04.1 lts...

機器學習和深度學習伺服器配置建議

模組 型號gpu 4 x nvidia tesla v100 gpu記憶體 32gb vcpu 核 40處理器 2.2 ghz主頻的intel xeon e5 2650 v4 broadwell 處理器 記憶體220gb ssd雲盤 4 x 960gb ssd 高效雲盤 4 x 6000gb hdd...

如何搭建一台深度學習伺服器

this post was kindly contributed by 資料科學中的r和python go there to comment and to read the full post.在計算機時代的早期,一名極客的滿足感很大程度上 於能diy一台機器。到了深度學習的時代,前面那句話仍然是對...