笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

GPU: 需要大规模的 GPU 集群，通常包括数十张具有 80 GB 或更多显存的 GPU（例如 NVIDIA A100 或 H100）。需要专门的硬件配置和高性能计算设施。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD EPYC），并且需要多个处理节点来支持分布式计算。
内存: 至少 1 TB 或更多的系统内存。
存储: 需要几百 GB 到 TB 级别的存储空间，建议使用高速 SSD 或分布式存储系统。

对于我们普通人的电脑，ollama模型的部署，你至少拥有一张有显存的n系显卡，再者就是电脑内存一定要在16g及以上

我的硬件信息，有两张8g的内存，一张英伟达显存为4g的3050显卡

查看内存信息：wmic memorychip get capacity, devicelocator, manufacturer, memorytype, speed
查看GPU的信息：nvidia-smi

二.cuda和cudnn的安装(解决显存不足的办法）

CUDA Unified Memory: CUDA 提供了统一内存（Unified Memory），允许 GPU 和 CPU 共享内存空间。这可以使得内存需求超出 GPU 显存时，数据可以存储在主机内存中并在需要时传输到 GPU。

1.cuda的选择与安装

1.打开NVIDIA控制面板>>>系统信息>>>组件

就这个：

可以看到我的是nvduda64.dll NVIDIA cuda 12.6.41 driver

2.进官网，选择相应的cuda,选择版本应该=

3.选择本地exe安装

4.双击安装包，自定义设置，勾选组件：

继续点下一步

点击关闭，安装结束

验证：cmd输入

最高版本：nvidia-smi
当前版本：nvcc --version

结果：

2.cudnn的安装
网址：https://developer.nvidia.com/cudnn-downloads?target_os=Windows

多版本：cuDNN Archive | NVIDIA Developer

下载的是一个压缩包，解压至你想保存的位置，并将解压的目录中的bin目录添加到环境变量里的系统变量path里面

这是我解压的bin文件夹位置：

D:appcudnnbin

验证是否成功：

找到你的这个目录，并将下面的变量添加到环境变量里的系统变量path里面

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.4extrasdemo_suite

打开cmd，分别输入

bandwidthTest.exe 
和
deviceQuery.exe

结果：

三.安装ollama

官网：Ollama

双击安装，默认会安到c盘，好像也没法改,但是看了一下也不是很大，大的是模型，待会会说怎么改模型的存储位置，install，等安装完：

它会自动启动

打开cmd,不用配置path啥的，输入下面两个代码看一下结果：

ollama

ollama list

OK啦

四.模型的选择和默认模型存储位置的更改

ollama官方提供的模型：llama3.1

小黄脸hugging face的模型（模型社区），有别人训练好的模型：https://huggingface.co/

模型的选择

1.更改模型下载位置

创建一个想要你想要保存模型的位置

添加系统环境变量

变量名：OLLAMA_MODELS

变量值：D:appOLLAMA_MODELS

2.ollama的模型下载

8b模型是我们目前能运行的最大模型

复制指令，cmd中输入，等下载完

上一步设置无误的话，下载文件会有在你的模型存储位置会有两个这样的文件

下载完后，它自己会启动，试着对话一下，还是很顺畅的

文章来源于互联网:笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

相关推荐: stable-diffusion.cpp 一个文件解决stable diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo

stable-diffusion.cpp 一个文件解决stable-diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo 目录介绍效果 Text To Image Image To Image Up…

笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

软硬件：win11,NVIDIA GeForce RTX 3050 显存4g

一.ollama模型最低要求

1. Llama 3.1 (8B) 模型

2. Llama 3.1 (70B) 模型

3. Llama 3.1 (405B) 模型

对于我们普通人的电脑，ollama模型的部署，你至少拥有一张有显存的n系显卡，再者就是电脑内存一定要在16g及以上

二.cuda和cudnn的安装(解决显存不足的办法）

三.安装ollama

四.模型的选择和默认模型存储位置的更改

1.更改模型下载位置

2.ollama的模型下载

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来