神舟t97 ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2

2023-12-04 02:40

本文主要是介绍神舟t97 ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

神舟t97   ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2

0前言

继续上篇博客《windwos10 +ubuntu16.4 双系统安装步骤(神舟t97)》,在t97上安装ubuntu16之后,为使用nvidia显卡的计算力,使t97成为深度学习的工作站,还要继续配置一系列nvidia显卡驱动、cuda工具、以及cudnn工具。因此本文会详细讲述nvidia驱动+cuda9.0+cudnn7.1.2的安装。

1前期工作

所需软件:①cuda9.0 下载地址  https://developer.nvidia.com/cuda-toolkit-archive  

             ②cudnn7.1.2下载地址https://developer.nvidia.com/rdp/cudnn-archive   (注意下载cudnn需要nvidia注册账号,比简单)

               ③nvidia驱动下载地址  https://www.geforce.cn/drivers(选择自己对应的版本384.13

!!!总结:所有的版本号是有cuda决定的,要选择对应的cudnnnvidia driver版本

软件名称

版本号

Cuda

9.0   384.13    

Cudnn

7.1.2 for 9.0 

Nvidia  Driver

384.13

他们三者之间的关系:cuda决定nvidiacudnn因为截至到2018430日,tensorflow-gpu还不支持cuda9.1因此要下载cuda9.09.0对应的是cudnn7.1.2nvidia384.13

小技巧:如果在linuxfirefox浏览器下载以上三个软件,切记要更换为国内下载源否则下载会很慢,浪费时间。

切换方法:在下图一中搜索“软件和更新”,出现图二时,选择国内国内服务器,输入认证密码,便设置成功。这样下载软件就比较快了( pip install 更新国内源有其他方法)
图二

此时在firefox进行三个软件的下载,下载存储位置为“下载”文件夹。

因为“下载”是中文字符,在alt+CTRL+F1命令界面是无法进行中文输入的,所有要将cuda_9.0.176_384.81_linux.runNVIDIA-Linux-x86_64-384.130.run复制到/usr/nvidiabag下。同时将这两个软件重命名为cuda9.384.runnvidia.384.run(在下载文件中重命名)

------------------------------------------------------------------------------------------------

复制方法: cd/usr      #进入usr文件夹

          Sudo mkdir nvidiabag  #新建nvidiabag文件夹

           cd下载

 sudo cp cuda9.384.run    /usr/nvidiabag      #复制文件

          Sudo cp nvidia.384.run    /usr/nvidiabag  

------------------------------------------------------------------------------------------------ 

Cudnn-9.0-linux-x64-v7.1tgz 仍然放在“下载”文件夹中

2安装步骤

2.1安装cuda9.0

    2.1.1命令输入$ lspci |grep -i nvidia         #确认可用的显卡

2.1.2!!!!重要:禁用nouveau drivers

禁用方法:$ gedit  /etc/modprobe.d/blacklist.conf   

在文档最后输入:

 blacklist nouveau

 options nouveau modeset=0

保存退出后,在命令行中输入:

$ sudo update-initramfs -u    #更新kernel initramfs 

查看是否禁用成功:

命令输入:$ lsmod |grep nouveau  

#若打印出信息,则没有被禁用(需要直接删除(自行百度下))  

 #若没有打印信息,则被禁用继续下一步

   2.1.3停止X服务(桌面服务)

   ①命令输入$: service lightdm stop

   ②出现黑色屏幕之后,同时按住 alt+ctrl+F1       进入命令行模式;

   ③登录用户名和密码,然后输入   $su   ----  输入密码,获得root权限

   ④命令输入 $: cd  /usr/nvidiabag     #cuda9.0安装软件和nvidia软件都在 usr下的nvidiabag文件夹中

  ⑤命令输入 $: sudo sh cuda9.384.run

开始运行,持续按回车就行。会遇到 yes/or 的问题,问是否安装 nvidia driver 时选择 yes ,是否安装 linux libray32 时选择 no ,选择是否 nvidia-x server ……选择 yes ,安装路径选择默认 default 即可。安装完成后出现下面

上图中的①②③分别表示--------------------------

红色方框①表示cuda9.0的安装位置

红色方框②表示安装路径待会要用

红色方框③表示卸载cuda和驱动的方法

-------------------------------------------------

继续第  命令输入 $: service lightdm start重启桌面服务  

第⑦步,进入桌面后,此时显示器的分辨率可能为小屏,修改分辨率为1920x1080的方法:终端中输入$sudo gedit /etc/X11/xorg.conf

打开的文档如下图所式,修改红色方框中的内容,最大值分别增加 100

然后重启,$:reboot  #重启

便是正常的分辨率了。

8步,验证nvidia driver 是否安装成功。终端输入$: nvidia-smi

输出界面应该为:下图中包含了 nVidia 的驱动 版本 384.130 和独立显卡的型号 GeForce gtx 1070max-q

 2.1.4cuda路径

 ①命令输入$ sudo gedit   /etc/profile

 ②在打开的文本最后输入

export  PATH = /usr/local/cuda-9.0/bin$PATH    #这是刚刚的默认安装路径

export  LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64:$ LD_LIBRARY_PATH

保存文件。如下图所示:

在终端中输入 source    /etc/profile       #使配置生效

检查cuda是否安装好

命令行输入$:cuda

然后按两下 tab键,出现信息,则表示安装成功

2.1.5卸载cuda9.0

--------------
卸载cuda
--------------
cd  /usr/local/cuda-9.0/bin/
sudo perl uninstall_cuda_9.0.pl

 2.2安装cudnn7.1.2

①命令输入$:cd 下载
②命令输入$: sudo tar xvf cudnn-9.0_linx-x64-v7.1.2.tgz#解压并安装tgz
③命令输入$:cd cuda  #进入cuda文件
sudo cp include/*   /usr/local/cuda-9.0/include       #将cuda文件的 /usr/local/cuda-9.0/include
⑤sudo cp lib64/libcudnn.so.7.1.2   /usr/local/cuda-9.0/lib64
sudo cp lib64/libcudnn-static.a  /usr/local/cuda.9.0/lib64
-----
更新软连接
-----
⑦cd /usr/local/cuda-9.0/lib64
⑧ln-s libcudnn.so.7.1.2  libcudnn.so.7
⑨ln-s libcudnn.so.7 libcudnn.so

此时已经安装成功,按说应该全部配置成功。但是在终端输入$:nvidia-smi

此时没有GPU信息输出。我解决的方法就是按照2.3的步骤,重新安装了一边nvidia    driver    384.13(已经重命名为nvidia.384.run

 2.3nvidia384.13

安装nvidia 驱动
①service lightdm stop
②sudo  ./ nvidia.384.run  -no-opengl-files
③service lightdm start
-------------------------------------------------
重新进入桌面后,发现屏幕分辨率不对,所以解决此问题(上面已经讲过)
-------------------------------------------------
①sudo gedit /etc/X11/xorg.conf
修改数据   28.0-155.0
            43.0-172.0  #
建议增大100
-------------------------------------------------
nvidia
驱动卸载方法
-------------------------------------------------
sudo <
驱动名字>--uninstall

2.4 续会继续安装tensorflow-gpu pycharm 以及DEEPQAubuntu中的配置问题。

 

这篇关于神舟t97 ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/451816

相关文章

JWT + 拦截器实现无状态登录系统

《JWT+拦截器实现无状态登录系统》JWT(JSONWebToken)提供了一种无状态的解决方案:用户登录后,服务器返回一个Token,后续请求携带该Token即可完成身份验证,无需服务器存储会话... 目录✅ 引言 一、JWT 是什么? 二、技术选型 三、项目结构 四、核心代码实现4.1 添加依赖(pom

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言:二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

Python库 Django 的简介、安装、用法入门教程

《Python库Django的简介、安装、用法入门教程》Django是Python最流行的Web框架之一,它帮助开发者快速、高效地构建功能强大的Web应用程序,接下来我们将从简介、安装到用法详解,... 目录一、Django 简介 二、Django 的安装教程 1. 创建虚拟环境2. 安装Django三、创

linux安装、更新、卸载anaconda实践

《linux安装、更新、卸载anaconda实践》Anaconda是基于conda的科学计算环境,集成1400+包及依赖,安装需下载脚本、接受协议、设置路径、配置环境变量,更新与卸载通过conda命令... 目录随意找一个目录下载安装脚本检查许可证协议,ENTER就可以安装完毕之后激活anaconda安装更

Jenkins的安装与简单配置过程

《Jenkins的安装与简单配置过程》本文简述Jenkins在CentOS7.3上安装流程,包括Java环境配置、RPM包安装、修改JENKINS_HOME路径及权限、启动服务、插件安装与系统管理设置... 目录www.chinasem.cnJenkins安装访问并配置JenkinsJenkins配置邮件通知

Linux查询服务器系统版本号的多种方法

《Linux查询服务器系统版本号的多种方法》在Linux系统管理和维护工作中,了解当前操作系统的版本信息是最基础也是最重要的操作之一,系统版本不仅关系到软件兼容性、安全更新策略,还直接影响到故障排查和... 目录一、引言:系统版本查询的重要性二、基础命令解析:cat /etc/Centos-release详

更改linux系统的默认Python版本方式

《更改linux系统的默认Python版本方式》通过删除原Python软链接并创建指向python3.6的新链接,可切换系统默认Python版本,需注意版本冲突、环境混乱及维护问题,建议使用pyenv... 目录更改系统的默认python版本软链接软链接的特点创建软链接的命令使用场景注意事项总结更改系统的默