rx6600xt(A卡)使用ollama GPU跑大模型(解决默认CPU运行问题)
摘要:本文介绍了在Windows环境下让AMD显卡(如RX6600XT)运行Ollama大模型时调用GPU的方法。由于官方Windows版Ollama对部分AMD GPU架构支持不完整,导致默认仅使用CPU。解决方案包括替换ROCm运行库(6.4.2版本)、更新rocblas计算库等步骤,使RX6000/7000系列显卡能以GPU运行模型,性能提升约10倍(从2-3 token/s提升至20-35
在 Windows 环境下,很多使用 AMD 显卡(如 RX6600XT) 的用户会发现:
使用官方 Ollama 运行大模型时 默认只使用 CPU,即使机器有 GPU 也不会调用。
原因是:
官方 Ollama Windows 版本只支持部分 AMD GPU 架构,很多显卡没有默认适配,因此只能 fallback 到 CPU。
本文介绍一种 通过替换 ROCm 库的方式,让 RX6600XT 等 AMD 显卡在 Windows 下使用 GPU 跑 Ollama 模型 的方法。
一、环境说明
本文测试环境:
| 硬件 | 配置 |
|---|---|
| CPU | Intel i7 |
| 内存 | 32GB |
| GPU | RX6600XT |
| 系统 | Windows 11 |
| Ollama | 官方最新版 |
| ROCm | 6.4.2 |
适用显卡架构:
点击查询A卡的gfx版本
其中 RX6600XT 属于 gfx1032 架构,理论上是可以跑 GPU 的,只是 Ollama 官方 Windows 版本没有完整打包 ROCm 依赖。
二、核心原理
Ollama Windows GPU 运行依赖 ROCm(HIP)库。
但官方安装包:
- ROCm 组件不完整
- 缺少部分
rocblas计算库 - GPU 架构列表不完整
解决方案:
手动替换 Ollama 的 ROCm 运行库。
核心步骤:
1️⃣ 安装官方 Ollama
2️⃣ 替换 ROCm 运行库
3️⃣ 更新 rocblas 库
4️⃣ 启动 Ollama
三、安装 Ollama
先安装官方版本:
OllamaSetup.exe
安装完成后,默认路径:
C:\Users\用户名\AppData\Local\Programs\Ollama
不想装C盘,可以用下面的命令换其他盘:
OllamaSetup.exe /DIR="d:\some\location"
重点目录:
C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm
四、替换 ROCm 运行库
下载适配版本:
下载地址
ollama-windows-amd64.7z (ROCm 6.4.2)
解压后,替换以下目录:
删除:
C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm
然后复制新的:
ollama-windows-amd64\rocm
C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\
五、更新 ROCm 计算库
Ollama GPU 推理依赖:
rocblas.dll
操作步骤:
进入:
C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm
找到:
rocblas
删除:
rocblas/library
然后下载 ROCmLibs 6.4.2,
替换为新的:
rocblas/library
目录结构示例:
rocm
├── rocblas.dll
├── rocblas
│ └── library
│ ├── TensileLibrary.dat
│ └── ...
六、特殊显卡(gfx1200 / gfx1201)
如果 GPU 识别异常,需要替换:
amdhip64.dll
来源:
C:\Windows\System32\amdhip64.dll
替换到:
Ollama\lib\ollama\rocm
七、启动 Ollama
安装完成后启动:
ollama serve
然后运行模型:
ollama run qwen:7b
如果 GPU 正常工作,可以看到:
GPU detected
ROCm initialized
也可以通过命令查看
ollama ps
也可以通过任务管理器,看 gpu 的使用情况,还可以右键 ollama 查看log,搜索显卡型号即可。
八、常见错误
1 amdgpu is not supported
错误示例:
amdgpu is not supported
supported types: [gfx1030 gfx1100 gfx1101 gfx1102 gfx906]
原因:
- ROCm libs 没有替换
- GPU 架构未包含
解决:
重新替换:
ROCmlibs 6.4.2
2 模型仍然跑 CPU
可能原因:
- rocblas 没替换
- GPU 架构未加入
- ROCm 版本错误
建议:
使用
ROCm 6.4.2
版本。
九、性能测试
测试模型:
qwen2:7b
| 运行方式 | Token速度 |
|---|---|
| CPU | 2~3 token/s |
| RX6600XT GPU | 20~35 token/s |
性能提升约 10 倍。
十、总结
在 Windows 上使用 AMD GPU 跑 Ollama,大部分问题来自 ROCm 运行库不完整。
核心解决方法:
1️⃣ 安装官方 Ollama
2️⃣ 替换 ROCm 运行库
3️⃣ 更新 rocblas 库
4️⃣ 必要时替换 amdhip64.dll
完成后即可让:
- RX6600XT
- RX6700XT
- RX6800
- RX7000 系列
在 Windows 上使用 GPU 推理大模型。
更多推荐


所有评论(0)