Ubuntu 16.04 LTS + CUDA8.0 + cudnn6.0

2024-06-05 13:48

本文主要是介绍Ubuntu 16.04 LTS + CUDA8.0 + cudnn6.0,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 简介
    • GPU对比
    • GPU浮点计算能力换算
  • 安装
    • 下载
    • 准备
    • 安装CUDA
      • 禁用 Nouveau 驱动
      • 进入文本模式
      • 执行安装
      • 添加环境变量
      • 加载新的环境变量
      • 查看CUDA设备
    • 安装CUDNN
  • CUDA使用
    • CUDA版本切换
  • 问题与解决
    • 循环进登录界面
    • you appear to be running an x server please exit x before installing
    • The driver installation is unable to locate the kernel
    • NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.

简介

本文记录本人安装CUDA的方法及过程中,以及出现的一些问题及解决办法。本人习惯于参考官方手册,这里主要参考 NVIDIA CUDA 官方手册 进行安装,其中包含了CUDA开发的几乎所有文档手册,如何在 Linux 系统上的安装CUDA参见: CUDA Linux Inatallation。

通过阅读上述手册可知,Linux系统上CUDA的安装方式有两种:包管理器方式(.deb 文件) 和 RUN file安装( .run 文件)。本文选择 run 格式安装,关于 deb 的安装请参考上述官方手册,或者本人另一篇博客 NVIDIA DIGITS 学习笔记(NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0),不过有点老了。

**参考手册: **

  • NVIDIA CUDA 官方手册
  • CUDA Linux Inatallation

软件环境:Ubuntu 16.04LTS
硬件环境:1080TI

您还可以参照企鹅饿饿饿的 Ububtu16.04+GTX1070深度学习小钢炮 这篇文章 ,

GPU对比

  • RTX 3090 Benchmarks for Deep Learning – NVIDIA RTX 3090 vs 2080 Ti vs TITAN RTX vs RTX 6000/8000

GPU浮点计算能力换算

参考

  • Nvidia GPU的浮点计算能力(FP64/FP32/FP16)

理论峰值 = GPU芯片数量*GPU Boost主频*核心数量*单个时钟周期内能处理的浮点计算次数

只不过在GPU里单精度和双精度的浮点计算能力需要分开计算,以最新的Tesla P100为例:

双精度理论峰值 = FP64 Cores * GPU Boost Clock * 2 = 1792 *1.48GHz*2 = 5.3 TFlops

单精度理论峰值 = FP32 cores * GPU Boost Clock * 2 = 3584 * 1.58GHz * 2 = 10.6 TFlops


安装

安装前请先参考 注意事项 部分…

下载

先给出下载链接:

  • CUDA
  • CUDNN

从 这里 选择操作系统并下载 run 格式的 CUDA开发套件,以及显卡驱动文件(一个文件,如:cuda_8.0.61_375.26_linux.run),如下图所示:

选择文件并下载CUDA

从 这里下载CUDNN,如 cudnn-8.0-linux-x64-v6.0.tgz,并解压得到 cudnn-8.0-linux-x64-v6.0 文件夹,里面仅包含一个 cuda 文件夹。

准备

参考这里 确认你的PC机上装有NVIDIA CUDA可计算显卡、支持的Linux版本系统、GCC等等。如果已确认,可飞过。

安装CUDA

禁用 Nouveau 驱动

执行 lsmod | grep nouveau 命令,无论输出什么,都说明nouveau驱动已加载,Ubuntu系统中,通过如下步骤禁用nouveau驱动。

  1. 创建 /etc/modprobe.d/blacklist-nouveau.conf 文件,输入如下内容并保存:
blacklist nouveau
options nouveau modeset=0
  1. 重新生成kernel initrd
    终端执行: sudo update-initramfs -u

提示成功后,往下看…

进入文本模式

  1. 进入文本模式:快捷键 Ctrl + Alt + F1 ,输入用户名密码登录系统。再次确保 nouveau 驱动没有被加载 (命令:lsmod | grep nouveau 什么也不输出代表已禁用)。

  2. 关闭X server服务: sudo service lightdm stop

执行安装

终端进入你下载的 run格式CUDA开发套件所在文件夹,执行该文件进行安装,命令示例如下,注意你的版本:

sudo sh cuda_<version>_linux.run
如:
sudo sh cuda_8.0.61_375.26_linux.run

在弹出的文本模式交互页面,按 Q 键退出文档查看,并根据提示输入 accept 接受协议。

之后根据自己需要,按提示设置,如安装路径等等。一般默认即可,但 注意: 安装过程中,不要选择OpenGL,否则会出现,循环进入登录界面 ,本人选择安装 CUDA Samples(建议安装,待会会借助它查看是否安装成功,及显卡信息),并安装在 Documents 文件夹下。

等待安装完成即可…

添加环境变量

注意:此环境变量为64位系统下的,32位的把lib64改成lib即可。

  • 方式1,仅修改用户变量
# setting the environment variables so CUDA will be foundecho "\nexport PATH=/usr/local/cuda-8.0/bin:$PATH" >> ~/.bashrc
echo "\nexport LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH" >> ~/.bashrc
  • 方式2,修改所有用户变量

先使用sudo gedit /etc/profile打开“profile”文件,或者 sudo gedit ~/.bashrc 打开“./bashrc”文件,然后在打开的文件的末尾添加如下代码并保存:

# setting the environment variables so CUDA will be found
# After open profile, Add follow code at the end of file
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

加载新的环境变量

添加好环境变量后,需要加载新的环境变量,才能应用于系统。

加载更新环境变量 source ~/.bashrc(方式1),source /etc/profilesource ~/.bashrc(方式2)。或者重新打开终端,或者干脆重启系统 .

**注:**如果你没有重启系统,还需要重启 X server 服务:sudo service lightdm start 进入图形界面。

现在,你可以关机,并取下亮机卡.

查看CUDA设备

终端进入你的 CUDA Samples安装目录,执行编译后运行 ./deviceQuery 输出显卡设备等信息。

cd NVIDIA_CUDA-8.0_Samples/1_Utilities/deviceQuery
make
./deviceQuery

若提示如下信息,说明NVIDIA显示驱动有问题, 使用 sudo apt --purge remove nvidia* 卸载, 重新安装时选择安装NVIDIA drivers。

./deviceQuery
./deviceQuery Starting...CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 30
-> unknown error
Result = FAIL

输出的信息 , 成功看到类似信息代表驱动及开发套件安装成功,下面安装CUDNN:

CUDA Device Query (Runtime API) version (CUDART static linking)Detected 2 CUDA Capable device(s)Device 0: "GeForce GTX 1080 Ti"CUDA Driver Version / Runtime Version          8.0 / 8.0CUDA Capability Major/Minor version number:    6.1Total amount of global memory:                 11172 MBytes (11715084288 bytes)(28) Multiprocessors, (128) CUDA Cores/MP:     3584 CUDA CoresGPU Max Clock rate:                            1582 MHz (1.58 GHz)Memory Clock rate:                             5505 MhzMemory Bus Width:                              352-bitL2 Cache Size:                                 2883584 bytesMaximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layersMaximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layersTotal amount of constant memory:               65536 bytesTotal amount of shared memory per block:       49152 bytesTotal number of registers available per block: 65536Warp size:                                     32Maximum number of threads per multiprocessor:  2048Maximum number of threads per block:           1024Max dimension size of a thread block (x,y,z): (1024, 1024, 64)Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)Maximum memory pitch:                          2147483647 bytesTexture alignment:                             512 bytesConcurrent copy and kernel execution:          Yes with 2 copy engine(s)Run time limit on kernels:                     NoIntegrated GPU sharing Host Memory:            NoSupport host page-locked memory mapping:       YesAlignment requirement for Surfaces:            YesDevice has ECC support:                        DisabledDevice supports Unified Addressing (UVA):      YesDevice PCI Domain ID / Bus ID / location ID:   0 / 3 / 0Compute Mode:< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >Device 1: "GeForce GTX 1080"CUDA Driver Version / Runtime Version          8.0 / 8.0CUDA Capability Major/Minor version number:    6.1Total amount of global memory:                 8111 MBytes (8504868864 bytes)(20) Multiprocessors, (128) CUDA Cores/MP:     2560 CUDA CoresGPU Max Clock rate:                            1734 MHz (1.73 GHz)Memory Clock rate:                             5005 MhzMemory Bus Width:                              256-bitL2 Cache Size:                                 2097152 bytesMaximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layersMaximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layersTotal amount of constant memory:               65536 bytesTotal amount of shared memory per block:       49152 bytesTotal number of registers available per block: 65536Warp size:                                     32Maximum number of threads per multiprocessor:  2048Maximum number of threads per block:           1024Max dimension size of a thread block (x,y,z): (1024, 1024, 64)Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)Maximum memory pitch:                          2147483647 bytesTexture alignment:                             512 bytesConcurrent copy and kernel execution:          Yes with 2 copy engine(s)Run time limit on kernels:                     YesIntegrated GPU sharing Host Memory:            NoSupport host page-locked memory mapping:       YesAlignment requirement for Surfaces:            YesDevice has ECC support:                        DisabledDevice supports Unified Addressing (UVA):      YesDevice PCI Domain ID / Bus ID / location ID:   0 / 1 / 0Compute Mode:< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >
> Peer access from GeForce GTX 1080 Ti (GPU0) -> GeForce GTX 1080 (GPU1) : No
> Peer access from GeForce GTX 1080 (GPU1) -> GeForce GTX 1080 Ti (GPU0) : NodeviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 8.0, CUDA Runtime Version = 8.0, NumDevs = 2, Device0 = GeForce GTX 1080 Ti, Device1 = GeForce GTX 1080

安装CUDNN

CUDNN是NVIDIA公司针对深度神经网络,开发的基于CUDA的计算库,用于加速计算,这里安装版本为6.0,目前最新为7.0,但安装方式不变,且十分简单。可参考 官方步骤

1.解压:进入“cudnn-8.0-linux-x64-v6.0.tgz”所在目录,将文件解压,如下:

#注意修改成你的目录
cd /home/liu/sfw
#解压
tar zxvf  cudnn-8.0-linux-x64-v6.0.tgz

2.copy文件至CUDA安装目录:解压后,在你的目录下生成一个“cuda”文件夹,对于cuDNN6.0的版本解压后生成“cudnn-8.0-linux-x64-v6.0”文件。使用如下命令copy,注意第二个有个-a参数,否则,拷贝过去的文件失去了链接。

$ sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

cuDNN安装完成。~-~

CUDA使用

CUDA版本切换

请移步本人博客: 计算机使用技巧-CUDA切换

问题与解决

循环进登录界面

有些童鞋安装好CUDA重启后会发现:电脑不断地在登录界面循环,这是由于安装时选择安装了 OpenGL ,参考这里,安装时按照上述步骤, 不选择安装OpenGL即可以前使用压缩命令压缩备份系统后再恢复,也会出现该现象,后来重装了系统。

you appear to be running an x server please exit x before installing

X 服务没有完全关闭.

sudo /etc/init.d/lightdm stop
cd /tmp
sudo rm -rf .X*

The driver installation is unable to locate the kernel

如果更新了内核, 会进不了桌面, 重装CUDA驱动又会提示 The driver installation is unable to locate the kernel , 这是由于 Ubuntu 内核版本与CUDA要求的版本不一致, CUDA9的官方文档要求的Linux版本为4.4.0 可参见CUDA手册.

  • 已安装内核版本查看: uname -r
  • 查看可以安装的内核: apt-cache search linux|grep linux-image
  • 选择一个内核版本并安装: sudo apt-get install linux-image-X.X.X.XX-generic linux-headers-X.X.X.XX-generic
  • 更新grub引导: sudo update-grup
  • 重启系统, 高级选项中选择新安装的内核版本系统, 也可以修改grub配置, 默认进入某个版本的系统: sudo gedit /etc/boot/grub/grub.cfg

如果上述查看的版本中含 4.4, 则可以通过, 开机进入grub高级菜单, 选择4.4版本内核的系统启动; 如果不存在, 可以通过上述步骤降低内核版本, 当然也可以安装CUDA10.

如果是安装cuda时出现上述错误,执行sudo apt-get --purge remove nvidia* 删除之前安装的驱动,再重新用 run包安装。

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.

使用 sudo apt --purge remove nvidia* 卸载驱动, 然后重装NVIDIA驱动, 如 NVIDIA-Linux-x86_64-430.50.run

参考

这篇关于Ubuntu 16.04 LTS + CUDA8.0 + cudnn6.0的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1033230

相关文章

Ubuntu设置程序开机自启动的操作步骤

《Ubuntu设置程序开机自启动的操作步骤》在部署程序到边缘端时,我们总希望可以通电即启动我们写好的程序,本篇博客用以记录如何在ubuntu开机执行某条命令或者某个可执行程序,需要的朋友可以参考下... 目录1、概述2、图形界面设置3、设置为Systemd服务1、概述测试环境:Ubuntu22.04 带图

Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题

《Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题》:本文主要介绍Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未... 目录一、前言二、系统架构检测三、卸载旧版 Go四、下载并安装正确版本五、配置环境变量六、验证安装七、常见

ubuntu如何部署Dify以及安装Docker? Dify安装部署指南

《ubuntu如何部署Dify以及安装Docker?Dify安装部署指南》Dify是一个开源的大模型应用开发平台,允许用户快速构建和部署基于大语言模型的应用,ubuntu如何部署Dify呢?详细请... Dify是个不错的开源LLM应用开发平台,提供从 Agent 构建到 AI workflow 编排、RA

ubuntu系统使用官方操作命令升级Dify指南

《ubuntu系统使用官方操作命令升级Dify指南》Dify支持自动化执行、日志记录和结果管理,适用于数据处理、模型训练和部署等场景,今天我们就来看看ubuntu系统中使用官方操作命令升级Dify的方... Dify 是一个基于 docker 的工作流管理工具,旨在简化机器学习和数据科学领域的多步骤工作流。

如何在Ubuntu上安装NVIDIA显卡驱动? Ubuntu安装英伟达显卡驱动教程

《如何在Ubuntu上安装NVIDIA显卡驱动?Ubuntu安装英伟达显卡驱动教程》Windows系统不同,Linux系统通常不会自动安装专有显卡驱动,今天我们就来看看Ubuntu系统安装英伟达显卡... 对于使用NVIDIA显卡的Ubuntu用户来说,正确安装显卡驱动是获得最佳图形性能的关键。与Windo

双系统电脑中把Ubuntu装进外接移动固态硬盘的全过程

《双系统电脑中把Ubuntu装进外接移动固态硬盘的全过程》:本文主要介绍如何在Windows11系统中使用VMware17创建虚拟机,并在虚拟机中安装Ubuntu22.04桌面版或Ubunt... 目录一、首先win11中安装vmware17二、磁盘分区三、保存四、使用虚拟机进行系统安装五、遇见的错误和解决

CentOS和Ubuntu系统使用shell脚本创建用户和设置密码

《CentOS和Ubuntu系统使用shell脚本创建用户和设置密码》在Linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设置密码,本文写了一个shell... 在linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设

Ubuntu中远程连接Mysql数据库的详细图文教程

《Ubuntu中远程连接Mysql数据库的详细图文教程》Ubuntu是一个以桌面应用为主的Linux发行版操作系统,这篇文章主要为大家详细介绍了Ubuntu中远程连接Mysql数据库的详细图文教程,有... 目录1、版本2、检查有没有mysql2.1 查询是否安装了Mysql包2.2 查看Mysql版本2.

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版,这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日(3 月 27 日)放出了 Beta 版 Ubuntu 25.04 系统镜像,代号“Pluc

Ubuntu中Nginx虚拟主机设置的项目实践

《Ubuntu中Nginx虚拟主机设置的项目实践》通过配置虚拟主机,可以在同一台服务器上运行多个独立的网站,本文主要介绍了Ubuntu中Nginx虚拟主机设置的项目实践,具有一定的参考价值,感兴趣的可... 目录简介安装 Nginx创建虚拟主机1. 创建网站目录2. 创建默认索引文件3. 配置 Nginx4