# AMD显卡Ollama安装
## 下载HIP SDK
请访问AMD官方网站下载最新的HIP SDK:
[AMD HIP SDK](https://www.amd.com/en/developer/resources/rocm-hub/hip-sdk.html)
若您的显卡型号未在官网列出,请参考相关教程,使用`roclibs`替换相应文件以确保兼容性。
## 获取Ollama代码库
通过GitHub获取Ollama的源代码。执行以下命令克隆仓库:
```bash
git clone https://github.com/ollama/ollama.git
这将下载整个代码库到您的本地机器上。
修改Ollama源代码以支持更多AMD显卡
添加显卡型号支持
编辑文件[Ollama根目录]/llm/generate/gen_windows.ps1
,在AMD显卡列表中添加您的显卡型号(如gfx1103.gfx1031...
)。
对于部分集成显卡(核显),由于Ollama默认屏蔽了它们,您还需要修改文件ollama/gpu/amd_windows.go
,大约第20行,将iGPUName = "AMD Radeon(TM) Graphics"
更改为一个不存在的名字,例如iGPUName = "AMD 2024 Graphics"
,以避免被识别为核显。
环境搭建
选择安装Visual Studio或MinGW作为开发环境。具体步骤请参阅Ollama官方文档:
编译与构建
完成上述设置后,在vs中打开Ollama项目,并在项目根目录下右键点击选择“在此处打开PowerShell窗口”。输入以下命令来配置编译环境:
$env:CGO_ENABLED="1"
go generate ./...
这些命令会自动下载所需的依赖项。下一步,全局搜索gfx1102
(当前支持的显卡型号之一),并根据自己的显卡型号(例如gfx1103
)在相应的文件中添加支持。主要修改位于llm/generate
文件夹下的gen_windows.ps1
文件。
修改完成后,在Ollama根目录下运行以下命令进行构建:
go build .
成功构建后,将在当前目录生成ollama.exe
文件。
运行Ollama服务
现在可以通过命令行启动Ollama服务:
./ollama serve
在同一文件夹中,通过以下命令运行模型(例如llama3
):
./ollama run llama3
官方编译安装
如果觉得上述过程过于复杂,可以选择直接编译官方提供的安装包。按照app/README.md
中的说明操作。首先下载并安装Inno Setup,然后在Ollama根目录运行以下PowerShell命令:
powershell -ExecutionPolicy Bypass -File .\scripts\build_windows.ps1
完成后,您可以在dist
文件夹中找到生成的安装包。安装该包即可轻松使用Ollama。
注意事项
- 如果使用zluda遇到兼容性问题,尝试移除
zluda
文件夹内的nvml.dll
文件。 - 考虑使用lobe chat改善终端界面体验:lobe chat
- 对于特定显卡型号(如
gfx90c:xnack-
,gfx1010:xnack-
,gfx1012:xnack-
),如果无法正常运行,需要在环境变量中设置HSA_OVERRIDE_GFX_VERSION
。
资源
编译好的版本和Rocblas文件已整合进此链接:likelovewant/ROCmLibs-for-gfx1103-AMD780M-APU
Ollama for AMD编译好的版本下载:likelovewant/ollama-for-amd/releases