离线环境使用ollama部署DeepSeek模型。无GPU，CPU推理所以部署这个笨蛋

new_wugan

1523人浏览 · 2025-04-16 15:07:41

new_wugan · 2025-04-16 15:07:41 发布

1.1 下载模型
在有网络的环境下下载DeepSeek 1.5B的GGUF格式模型，资源足够的话，理论上你想部署啥就部署啥模型：
推荐去hugginface下载或者魔搭：
这里我是魔搭下载的量化版：https://modelscope.cn/models/ggml-org/DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/files
下载ubuntu官方镜像：docker pull ubuntu:22.04
下载ollama：https://github.com/ollama/ollama/releases
ollama-linux-amd64.tgz
解压成ollama-linux-amd64。
1.2 服务器创建目录
mkdir -p ollama/models
2. Docker配置
2.1 创建Dockerfile

使用官方Ollama镜像作为基础

FROM ubuntu:22.04

安装必要的依赖

RUN apt-get update && apt-get install -y
curl
wget
&& rm -rf /var/lib/apt/lists/*

创建工作目录

WORKDIR /app

复制整个Ollama目录

COPY ollama-linux-amd64 /app/ollama

# 设置权限

RUN chmod +x /app/ollama/bin/ollama

# 设置库文件路径

ENV LD_LIBRARY_PATH=/app/ollama/lib: $LD_LIBRARY_PATH ENV PATH=/app/ollama/bin:$ PATH

复制模型文件到容器中

COPY ./DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/deepseek-r1-distill-qwen-1.5b-q4_0.gguf /root/.ollama/models/

设置环境变量

ENV OLLAMA_HOST=0.0.0.0
ENV OLLAMA_ORIGINS=*

暴露端口

EXPOSE 11434

启动命令

CMD [“/app/ollama/bin/ollama”, “serve”]

在这里插入图片描述

2.2 构建镜像
docker build -t ollama-deepseek:1.5b .
3.1 创建数据卷
docker volume create ollama-data
3.2 运行容器
docker run -d
–name ollama-deepseek
-p 11434:11434
-v ollama-data:/root/.ollama
–cpus 4 \ # 限制CPU使用
–memory 4g \ # 限制内存使用
ollama-deepseek:1.5b

–cpus 和memory 看具体情况是否加上

3.3容器运行成功，看下面离线文档:2.容器内操作
离线环境使用ollama部署DeepSeek模型。无GPU，CPU推理所以部署这个笨蛋
4.2 测试模型
构建的modelfile叫deepseek。
curl http://localhost:11434/api/generate -d ‘{
“model”: “deepseek”,
“prompt”: “你好，请介绍一下你自己”,
“stream”: false
}’
3. 监控和管理
5.1 查看日志
docker logs ollama-deepseek
5.2 查看资源使用
docker stats ollama-deepseek
5.3 重启容器
docker restart ollama-deepseek
4. 注意事项
5. 系统要求：

建议至少8GB内存
CPU核心数建议4核以上
磁盘空间至少2GB

性能优化：

根据实际需求调整CPU和内存限制
可以通过环境变量调整Ollama配置
建议使用4-bit量化版本以节省资源

数据安全：

定期备份数据卷
监控系统资源使用情况
设置适当的访问权限

故障处理：

检查容器日志排查问题
确保端口未被占用
验证模型文件完整性

常见问题
模型加载失败：

检查模型文件路径
验证文件权限
确认磁盘空间充足

性能问题：

调整CPU和内存限制
检查系统资源使用情况
考虑使用更高性能的量化版本

连接问题：

验证端口是否开放
检查防火墙设置
确认容器运行状态

=============================================
PS：以下是LZ已经构建好的deepseek1.5基于ollama的镜像，上面是自定义模型构建的过程。
DeepSeek 1.5B 离线部署文档

镜像部署

1.1 加载镜像（文件获取看网盘）
docker load < ollama-deepseek-final.tar

1.2 运行容器
docker run -d
–name ollama-deepseek
-p 11434:11434
-v ollama-data:/root/.ollama
ollama-deepseek:1.5b

容器内操作

2.1 进入容器
docker exec -it ollama-deepseek bash

2.2 创建模型配置

创建目录

mkdir -p /root/.ollama/models/deepseek

cat > /root/.ollama/models/deepseek/Modelfile << ‘EOF’
FROM /root/.ollama/models/deepseek-r1-distill-qwen-1.5b-q4_0.gguf

PARAMETER temperature 0.7
PARAMETER num_ctx 4096

SYSTEM “”"
You are a helpful AI assistant.
“”"
EOF

2.3 创建模型
cd /root/.ollama/models/deepseek
ollama create deepseek -f Modelfile
ps:这里可自定义模型名称： create XXX -f Modelfile
2.4 验证模型

查看模型列表

ollama list

测试模型

ollama run deepseek “你好，请介绍一下你自己”

API使用

3.1 使用curl测试
curl http://localhost:11434/api/generate -d ‘{
“model”: “deepseek”,
“prompt”: “你好，请介绍一下你自己”,
“stream”: false
}’

在这里插入图片描述

太笨了。
3.2 使用Python测试
import requests

response = requests.post(
‘http://localhost:11434/api/generate’,
json={
‘model’: ‘deepseek’,
‘prompt’: ‘你好，请介绍一下你自己’,
‘stream’: False
}
)
print(response.json())

维护命令

4.1 查看容器状态
docker ps
docker logs ollama-deepseek

4.2 重启容器
docker restart ollama-deepseek

4.3 查看资源使用
docker stats ollama-deepseek

注意事项
确保服务器有足够的内存（建议至少8GB）
模型文件位于 /root/.ollama/models/ 目录
服务运行在11434端口
可以通过环境变量调整配置
定期检查容器日志和资源使用情况

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

让 Codex 桌面版拥抱 DeepSeek-V4：协议桥接与模型网关接入实践

4SAPI 提供了一套标准的 Chat Completions 接口，完全兼容 DeepSeek V4 Pro 等模型，使用时只需将 base URL 和密钥替换为平台分配的值即可。这样一来，既保留了桥接层的协议转换能力，又获得了网关带来的额外弹性。这样的模型网关，则进一步提升了链路的稳定性和密钥管理的便捷度，尤其适合团队或对服务可用性有更高要求的场景。│Codex 桌面版│ ──────────

AI Agent技术社区

别再迷信“突破限制”：Gemini 3.5-flash 边界测试实战复盘

AI Agent技术社区

想要转型AI Agent开发？现在开始学，还不晚

用 @tool 装饰器定义工具@tool"""搜索互联网获取实时信息。当需要最新数据时使用此工具。"""# 实际接入 Tavily / Serper 等搜索 APIreturnf"搜索结果：关于 {query} 的最新信息..."@tool"""计算数学表达式，如 '2 + 3 * 4'"""# 绑定工具到模型# 模型会自动决定是否调用工具response = llm_with_tools.inv