在 Windows 环境下,很多使用 AMD 显卡(如 RX6600XT) 的用户会发现:
使用官方 Ollama 运行大模型时 默认只使用 CPU,即使机器有 GPU 也不会调用。

原因是:
官方 Ollama Windows 版本只支持部分 AMD GPU 架构,很多显卡没有默认适配,因此只能 fallback 到 CPU。

本文介绍一种 通过替换 ROCm 库的方式,让 RX6600XT 等 AMD 显卡在 Windows 下使用 GPU 跑 Ollama 模型 的方法。


一、环境说明

本文测试环境:

硬件 配置
CPU Intel i7
内存 32GB
GPU RX6600XT
系统 Windows 11
Ollama 官方最新版
ROCm 6.4.2

适用显卡架构:
点击查询A卡的gfx版本

其中 RX6600XT 属于 gfx1032 架构,理论上是可以跑 GPU 的,只是 Ollama 官方 Windows 版本没有完整打包 ROCm 依赖


二、核心原理

Ollama Windows GPU 运行依赖 ROCm(HIP)库

但官方安装包:

  • ROCm 组件不完整
  • 缺少部分 rocblas 计算库
  • GPU 架构列表不完整

解决方案:

手动替换 Ollama 的 ROCm 运行库。

核心步骤:

1️⃣ 安装官方 Ollama
2️⃣ 替换 ROCm 运行库
3️⃣ 更新 rocblas 库
4️⃣ 启动 Ollama


三、安装 Ollama

先安装官方版本:

OllamaSetup.exe

安装完成后,默认路径:

C:\Users\用户名\AppData\Local\Programs\Ollama

不想装C盘,可以用下面的命令换其他盘:

OllamaSetup.exe /DIR="d:\some\location"

重点目录:

C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm

四、替换 ROCm 运行库

下载适配版本:
下载地址

ollama-windows-amd64.7z  (ROCm 6.4.2)

解压后,替换以下目录:

删除:

C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm

然后复制新的:

ollama-windows-amd64\rocm

C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\

五、更新 ROCm 计算库

Ollama GPU 推理依赖:

rocblas.dll

操作步骤:

进入:

C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm

找到:

rocblas

删除:

rocblas/library

然后下载 ROCmLibs 6.4.2

替换为新的:

rocblas/library

目录结构示例:

rocm
 ├── rocblas.dll
 ├── rocblas
 │    └── library
 │        ├── TensileLibrary.dat
 │        └── ...

六、特殊显卡(gfx1200 / gfx1201)

如果 GPU 识别异常,需要替换:

amdhip64.dll

来源:

C:\Windows\System32\amdhip64.dll

替换到:

Ollama\lib\ollama\rocm

七、启动 Ollama

安装完成后启动:

ollama serve

然后运行模型:

ollama run qwen:7b

如果 GPU 正常工作,可以看到:

GPU detected
ROCm initialized

也可以通过命令查看

ollama ps

也可以通过任务管理器,看 gpu 的使用情况,还可以右键 ollama 查看log,搜索显卡型号即可。


八、常见错误

1 amdgpu is not supported

错误示例:

amdgpu is not supported
supported types: [gfx1030 gfx1100 gfx1101 gfx1102 gfx906]

原因:

  • ROCm libs 没有替换
  • GPU 架构未包含

解决:

重新替换:

ROCmlibs 6.4.2

2 模型仍然跑 CPU

可能原因:

  • rocblas 没替换
  • GPU 架构未加入
  • ROCm 版本错误

建议:

使用

ROCm 6.4.2

版本。


九、性能测试

测试模型:

qwen2:7b
运行方式 Token速度
CPU 2~3 token/s
RX6600XT GPU 20~35 token/s

性能提升约 10 倍


十、总结

在 Windows 上使用 AMD GPU 跑 Ollama,大部分问题来自 ROCm 运行库不完整

核心解决方法:

1️⃣ 安装官方 Ollama
2️⃣ 替换 ROCm 运行库
3️⃣ 更新 rocblas 库
4️⃣ 必要时替换 amdhip64.dll

完成后即可让:

  • RX6600XT
  • RX6700XT
  • RX6800
  • RX7000 系列

Windows 上使用 GPU 推理大模型

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐