最近在使用之前搭建好tensorflow-gpu環境的伺服器時,突然發現gpu無法使用了。用命令nvidia-smi
查一下發現顯示卡驅動不見了,於是開始著手安裝顯示卡。但是之前沒有在伺服器上安裝顯示卡的經驗,上網搜了一下發現也沒有比較完整的教程,於是通過查詢資料加上自己的摸索,花費了大半天時間終於把顯示卡驅動安裝好了。這裡記錄一下,也便於以後自己重新安裝的時候使用。
centos 7.5 + nvidia tesla k80
nvidia-410.66
注意:以下步驟全部是在root環境下操作,所以要先使用sudo su
進入root環境
rpm --import
rpm -uvh
# 這裡的-7.0.2-是中的7是指centos的版本
yum install nvidia-detect
nvidia-detect -v
這裡要注意輸出的資訊中的數字,比如我的輸出是this device requires the current 410.66 nvidia driver kmod-nvidia
,表示我需要安裝的顯示卡驅動版本是410.66
yum -y install kernel-devel
yum -y install epel-release
yum -y install dkms
ps:我也不知道這些包是幹什麼的,也不知道有沒有用,但是裝了肯定沒問題
vim /etc/default/grub
在grub_cmdline_linux
中的末尾(注意要包含在引號內)新增/rd.driver.blacklist=nouveau nouveau.modeset=0
隨後生成配置
grub2-mkconfig -o /boot/grub2/grub.cfg
vim /etc/modprobe.d/blacklist.conf
新增
blacklist nouveau
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
dracut /boot/initramfs-$(uname -r).img $(uname -r)
重啟
reboot
lsmod | grep nouveau
如果沒有輸出則表明禁用成功
yum -y install kmod-nvidia-410.66
這裡末尾的數字是自己顯示卡對應的版本號,根據nvidia-detect -v
檢測得到的結果輸入
重啟後使用命令nvidia-smi
檢測顯示卡是否安裝成功。
本文的大部分內容**於該鏈結,但根據實際情況以及其他人的經驗做了一些簡單修改。
CentOS 7 安裝NVIDIA驅動
1 安裝對應版本核心原始碼包 gcc 如下圖三個rpm檔案可在安裝u盤packages目錄下找 sudo rpm ivh 包名.rpm 執行安裝。安裝gcc sudo yum install gcc c 2 禁用系統nouveau su echo e blacklist nouveau noptio...
CentOS7安裝NVIDIA顯示卡驅動
安裝依賴項 yum install y gcc gcc c kernel devel檢查核心版本和核心版本是否一致,否則安裝會報錯 遮蔽nvidiafb vi lib modprobe.d dist blacklist.conf將nvidiafb注釋掉 blacklist nvidiafb然後新增如...
centos 7 安裝Nvidia驅動及cuda
面向centos 7 暫時有點亂,有空的時候整理一下 安裝依賴 檢查是否安裝gpu lspci grep i nvidia 安裝gcc g 安裝依賴包檔案kernel devel kernel headers yum install 此步驟盡量省略 使用root許可權使開機時進入字元介面system...