如何设置ollama使用GPU并提高GPU使用率，不让你的CPU满载，不会出现卡顿。

时隔4年重新回到技术岗位，让我身心倍感轻松很喜欢很享受

在看这个文章之前先看下这个表，看看自己显卡是否支持然后再看后续文章

显卡支持表

我的就是2020年买的笔记本，还是2060的卡基本计算能力在7.5左右所以还是可以再站几年的

输入命令 nvidia-smi

image.png

安装 CUDA Toolkit.png

下载相关文件，请记住流程安装选local而非network 具体请问网上更多大模型会描述的很清楚为什么选local

image.png

安装完后验证是否安装成功

打开cmd 输入 nvcc --version 显示版本号表示下载成功

image.png

到此安装部分全部结束，再次使用cmd命令查看 nvidia-smi 就会发现cuda version也做了更改

image.png

到这里还没有安装ollama，去自行安装ollama傻瓜式安装即可

现在就可以设置ollama使用deepseek r1模型跑在gpu上了，就不会出现ppt一样回答问题的情况了
昨天我跑了一次，同一个问题 gpu运行时间11s，cpu运行时间3分钟

第一步打开系统变量，无法新增编辑就已管理员身份运行即可

image.png

添加以下环境变量：
- 变量名：OLLAMA_GPU_LAYER
- 变量值：cuda
指定特定的 GPU，可以添加以下环境变量：
- 变量名：CUDA_VISIBLE_DEVICES
- 变量值：GPU的UUID（按编号有时找不到，所以使用UUID，下文提到了本机gpu查UUID的命令）
  
  image.png