Ubuntu Server 16.04 上的 DKMS

以西结

最近的内核更新破坏了我的 Cuda 安装(如果我启动旧内核,它可以正常工作) - 非常相似的设置在其他机器上的内核更新中仍然存在,主要区别在于此安装是 Ubuntu Server,其他的是 Ubuntu Desktop。这听起来像 DKMS 问题吗?或者是其他东西?如何让我的 cuda 模块针对新内核构建自己?

我有 Ubuntu 16.04、Cuda 10.0(由本地 .deb 安装)、nvidia 驱动程序 410.48(在 cuda 安装过程中自动安装)和一个 2080Ti GPU

$ ls -al /boot
total 111740
drwxr-xr-x  3 root root     4096 Apr  9 12:02 .
drwxr-xr-x 24 root root     4096 Apr  4 16:53 ..
-rw-r--r--  1 root root  1252376 Jan 16 23:29 abi-4.4.0-142-generic
-rw-r--r--  1 root root   190580 Jan 16 23:29 config-4.4.0-142-generic
-rw-r--r--  1 root root   190580 Mar 26 14:02 config-4.4.0-145-generic
drwxr-xr-x  5 root root     4096 Apr  9 12:02 grub
-rw-r--r--  1 root root 50832836 Apr  4 16:54 initrd.img-4.4.0-142-generic
-rw-r--r--  1 root root 39170185 Apr  9 11:15 initrd.img-4.4.0-145-generic
-rw-r--r--  1 root root   182704 Jan 28  2016 memtest86+.bin
-rw-r--r--  1 root root   184380 Jan 28  2016 memtest86+.elf
-rw-r--r--  1 root root   184840 Jan 28  2016 memtest86+_multiboot.bin
-rw-r--r--  1 root root      255 Jan 16 23:29 retpoline-4.4.0-142-generic
-rw-------  1 root root  3904797 Jan 16 23:29 System.map-4.4.0-142-generic
-rw-------  1 root root  3906115 Mar 26 14:02 System.map-4.4.0-145-generic
-rw-------  1 root root  7184032 Jan 16 23:29 vmlinuz-4.4.0-142-generic
-rw-------  1 root root  7188984 Mar 27 10:03 vmlinuz-4.4.0-145-generic

$ dkms status
bbswitch, 0.8, 4.4.0-142-generic, x86_64: installed
bbswitch, 0.8, 4.4.0-145-generic, x86_64: installed
nvidia-410, 410.48, 4.4.0-142-generic, x86_64: installed

$ ls -al /usr/src
total 44
drwxr-xr-x 11 root root 4096 Apr  9 12:02 .
drwxr-xr-x 12 root root 4096 Mar 14 12:56 ..
drwxr-xr-x  2 root root 4096 Mar 14 11:05 bbswitch-0.8
drwxr-xr-x  5 root root 4096 Mar 14 14:55 cudnn_samples_v7
drwxr-xr-x  3 root root 4096 Mar 14 12:56 gmock
drwxr-xr-x  4 root root 4096 Mar 14 12:56 gtest
drwxr-xr-x 27 root root 4096 Feb 27 18:41 linux-headers-4.4.0-142
drwxr-xr-x  7 root root 4096 Feb 27 18:43 linux-headers-4.4.0-142-generic
drwxr-xr-x 27 root root 4096 Apr  4 16:53 linux-headers-4.4.0-145
drwxr-xr-x  7 root root 4096 Apr  4 16:53 linux-headers-4.4.0-145-generic
drwxr-xr-x  8 root root 4096 Mar 14 14:49 nvidia-410-410.48

$ ls -alR /var/lib/dkms
[Very long output] https://pastebin.com/RRMsBT0s
海尼玛

$ dkms 状态

bbswitch, 0.8, 4.4.0-142-generic, x86_64: installed
bbswitch, 0.8, 4.4.0-145-generic, x86_64: installed
nvidia-410, 410.48, 4.4.0-142-generic, x86_64: installed

这向我们表明 nvidia-410 dkms 驱动程序没有构建在内核 4.4.0-145-generic 上。应该有第 4 行,如下所示:

nvidia-410, 410.48, 4.4.0-145-generic, x86_64: installed

谁知道为什么它没有建立在 -145 内核上……那里有一个 dkms.conf 文件。

Cuda 10.0 可以从这里下载安装文件在这里

下载 Cuda 包并重新安装。然后执行一个dkms status命令并验证它是否显示了第 4 行,如我上面所示。

注意:如果您想要更新版本的 Nvidia 驱动程序,最新版本是 418.56。我不能说它是否与 Cuda 10.0.0 兼容。

注意:如果 Cuda/Nvidia 软件包中存在错误,您可能必须在每次更新内核时执行此操作:-(

更新 #1:

最近的更新导致 Nvidia 视频驱动程序 410 不能建立在当前内核上。

Cuda 10.0 安装 Nvidia 视频驱动程序 410。

Cuda 10.1 安装了 Nvidia 视频驱动程序 418。

Cuda 10.1 有 tensorflow 的问题。

用户需要带有可运行的 Nvidia 视频驱动程序的 Cuda 10.0。

用户正在请求 Nvidia 的进一步帮助。

更新#2:

试试这个...

删除 Cuda 10.1 和视频驱动程序 418。

重新安装 Cuda 10.0 和视频驱动程序 410。

这将使您回到开始状态。

让我们尝试手动构建 410 驱动程序...

sudo dkms build nvidia-410/410.48 # 构建可能会失败,但请给我们一个原因

sudo dkms install nvidia-410/410.48 # 如果构建是干净的,则运行

dkms status # 验证当前内核上的 410 安装

更新 #3:

事实证明,安装 Cuda 10.0/10.1 都不会自动安装 Nvidia 视频驱动程序,反之亦然。

最终的解决方案是让用户手动安装所需的Cuda 10.0,并手动安装最新的Nvidia显卡驱动程序418.56,一切又正常了。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在 Ubuntu 16-04 上安装 opencv

来自分类Dev

在 Ubuntu 20 上安装 virtualbox-dkms 时出错

来自分类Dev

无法在 Ubuntu 20.04.1 LTS 上安装 Rock-dkms

来自分类Dev

在Ubuntu 16上分区

来自分类Dev

在VirtualBox(VM Ubuntu)上安装构建必需的dkms和Guest Additions之后,黑屏/无响应

来自分类Dev

在 ubuntu 20.04 上安装 AMDGPU 驱动程序时无法构建 amdgpu-dkms

来自分类Dev

尝试在 virtualbox (virtualbox-guest-dkms) 中的 ubuntu 上安装 sublime text 时出错

来自分类Dev

如何在Ubuntu 14,04 LTS上安装Muvizu?

来自分类Dev

sagemath在ubuntu 16上安装失败

来自分类Dev

如何在Ubuntu 16上设置Mongodb?

来自分类Dev

在Ubuntu Core 16上安装webdm的问题

来自分类Dev

在Ubuntu 16上更新Qt版本

来自分类Dev

WSL,Ubuntu 16,04:apt-cache处于损坏状态

来自分类Dev

Ubuntu-16-04:如何从 wifi 托盘中移除 wifi 适配器

来自分类Dev

Ubuntu 16,04 GUI 仅在切换到 tty 或从 tty 切换时更新

来自分类Dev

Virtualbox 6.1.10,在内核5.8.0上构建的Ubuntu 20.04错误的返回状态,程序包virtualbox-dkms错误

来自分类Dev

Ubuntu Server 14.04上的SSL

来自分类Dev

Ubuntu Server 14.04上的Torrent

来自分类Dev

在云上安装Ubuntu Server

来自分类Dev

Ubuntu Server 17.10上的MaaS

来自分类Dev

Nvidia和Ubuntu 17.04,dkms模块问题

来自分类Dev

在自制Linux系统上安装DKMS

来自分类Dev

以下软件包具有未满足的依赖性:无法安装任何软件。Ubuntu的16:04

来自分类Dev

装有Ubuntu-20-04的HP Elitebook上的触摸板按钮不起作用

来自分类Dev

带有 Ubuntu-20-04 的 HP Elitebook 上的触摸板按钮不起作用

来自分类Dev

在Ubuntu 16上重新安装Owncloud 9

来自分类Dev

Ubuntu 16上php7的Apache2错误

来自分类Dev

如何在Beaglebone Black上安装Ubuntu Core 16?

来自分类Dev

Ubuntu 16上缺少一些菜单栏

Related 相关文章

  1. 1

    在 Ubuntu 16-04 上安装 opencv

  2. 2

    在 Ubuntu 20 上安装 virtualbox-dkms 时出错

  3. 3

    无法在 Ubuntu 20.04.1 LTS 上安装 Rock-dkms

  4. 4

    在Ubuntu 16上分区

  5. 5

    在VirtualBox(VM Ubuntu)上安装构建必需的dkms和Guest Additions之后,黑屏/无响应

  6. 6

    在 ubuntu 20.04 上安装 AMDGPU 驱动程序时无法构建 amdgpu-dkms

  7. 7

    尝试在 virtualbox (virtualbox-guest-dkms) 中的 ubuntu 上安装 sublime text 时出错

  8. 8

    如何在Ubuntu 14,04 LTS上安装Muvizu?

  9. 9

    sagemath在ubuntu 16上安装失败

  10. 10

    如何在Ubuntu 16上设置Mongodb?

  11. 11

    在Ubuntu Core 16上安装webdm的问题

  12. 12

    在Ubuntu 16上更新Qt版本

  13. 13

    WSL,Ubuntu 16,04:apt-cache处于损坏状态

  14. 14

    Ubuntu-16-04:如何从 wifi 托盘中移除 wifi 适配器

  15. 15

    Ubuntu 16,04 GUI 仅在切换到 tty 或从 tty 切换时更新

  16. 16

    Virtualbox 6.1.10,在内核5.8.0上构建的Ubuntu 20.04错误的返回状态,程序包virtualbox-dkms错误

  17. 17

    Ubuntu Server 14.04上的SSL

  18. 18

    Ubuntu Server 14.04上的Torrent

  19. 19

    在云上安装Ubuntu Server

  20. 20

    Ubuntu Server 17.10上的MaaS

  21. 21

    Nvidia和Ubuntu 17.04,dkms模块问题

  22. 22

    在自制Linux系统上安装DKMS

  23. 23

    以下软件包具有未满足的依赖性:无法安装任何软件。Ubuntu的16:04

  24. 24

    装有Ubuntu-20-04的HP Elitebook上的触摸板按钮不起作用

  25. 25

    带有 Ubuntu-20-04 的 HP Elitebook 上的触摸板按钮不起作用

  26. 26

    在Ubuntu 16上重新安装Owncloud 9

  27. 27

    Ubuntu 16上php7的Apache2错误

  28. 28

    如何在Beaglebone Black上安装Ubuntu Core 16?

  29. 29

    Ubuntu 16上缺少一些菜单栏

热门标签

归档