文章目录
隐藏
近期,尝试在家里服务中搭建一个用来跑 AI 的服务器,尝试使用 EXSI8.0 + ubuntu 搭建,因 exsi + ubuntu 无法安装最新版本 N 卡驱动,原因:安装上后,nvidia-smi 找不到设备,exsi+ubuntu 的方式行不通,所以改为 exsi+debian 的方式搭建。
虚拟机配置如下:
- EPYC 7302 * 48
- 基于 ESXi-8.0U2 平台
- NVIDIA GeForce RTX 3060(12G)
- 128G 内存
- Debian GNU/Linux 12 (bookworm) x86_64
RTX 3060 显卡驱动安装
主要过程
首先配置虚拟机,按设置:
- 锁定全部内存
- 设置
hypervisor.cpuid.v0=FALSE - 设置
pciPassthru0.msiEnabled=FALSE - 设置
pciPassthru.use64bitMMIO=TRUE - 设置
pciPassthru.64bitMMIOSizeGB=24(这个数字填写 2*GPU 显存总量。例如我的 3060 显存 12G,这里填写 24 即可)
在虚拟机内,首先配置 apt 源,使之包含 non-free-firmware。在 /etc/apt/source.list 中,添加 non-free-firmware,完成后应该形如:
deb https://deb.debian.org/debian/ bookworm main contrib non-free non-free-firmware
然后,
sudo apt update
apt search nvidia-driver
直接使用 apt 安装驱动,会出现如下错误:
Detected NVIDIA GPUs:
1b:00.0 VGA compatible controller [0300]: NVIDIA Corporation GA102 [GeForce RTX 3090] [10de:2204] (rev a1)
Checking card: NVIDIA Corporation GA102 [GeForce RTX 3090] (rev a1)
Uh oh. Your card is not supported by any driver version up to 545.23.06.
A newer driver may add support for your card.
Newer driver releases may be available in backports, unstable or experimental.
解决方案
简单来说,需要安装开放版本的 NVIDIA 驱动而不是默认的。论坛中的回答表示应该使用 .run 文件安装,并附加参数 -m=kernel-open,我不清楚是否有可以解决这个问题的 deb 包。
在应用这个方案之前,首先需要清理之前的安装。
sudo nvidia-uninstall
sudo apt purge -y '^nvidia-*' '^libnvidia-*'
sudo rm -r /var/lib/dkms/nvidia
sudo apt -y autoremove
sudo update-i
文章来源于互联网:AIGC 实战(环境篇) – EXSI 8.0 Debian安装RTX3060显卡驱动
【落霞归雁思维框架 · 地理应用】 用 4 步把 GIS 变成“会思考的地图” ——从现象到闭环,一份可复制 100 次的实战 SOP 作者:落霞归雁(CSDN 首发,转载请注明出处) 摘要:把“落霞归雁”四步引擎(观察→找规律→应用→验证)搬进地理空间,用 …
5bei.cn大模型教程网










