离线环境使用ollama部署DeepSeek模型。无GPU,CPU推理所以部署这个笨蛋
1.1 下载模型在有网络的环境下下载DeepSeek 1.5B的GGUF格式模型,资源足够的话,理论上你想部署啥就部署啥模型:推荐去hugginface下载或者魔搭:这里我是魔搭下载的量化版:https://modelscope.cn/models/ggml-org/DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/files下载ubuntu官方镜像:docker p
1.1 下载模型
在有网络的环境下下载DeepSeek 1.5B的GGUF格式模型,资源足够的话,理论上你想部署啥就部署啥模型:
推荐去hugginface下载或者魔搭:
这里我是魔搭下载的量化版:https://modelscope.cn/models/ggml-org/DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/files
下载ubuntu官方镜像:docker pull ubuntu:22.04
下载ollama:https://github.com/ollama/ollama/releases
ollama-linux-amd64.tgz
解压成ollama-linux-amd64。
1.2 服务器创建目录
mkdir -p ollama/models
2. Docker配置
2.1 创建Dockerfile
使用官方Ollama镜像作为基础
FROM ubuntu:22.04
安装必要的依赖
RUN apt-get update && apt-get install -y
curl
wget
&& rm -rf /var/lib/apt/lists/*
创建工作目录
WORKDIR /app
复制整个Ollama目录
COPY ollama-linux-amd64 /app/ollama
# 设置权限
RUN chmod +x /app/ollama/bin/ollama
# 设置库文件路径
ENV LD_LIBRARY_PATH=/app/ollama/lib:LDLIBRARYPATHENVPATH=/app/ollama/bin:LD_LIBRARY_PATH ENV PATH=/app/ollama/bin:LDLIBRARYPATHENVPATH=/app/ollama/bin:PATH
复制模型文件到容器中
COPY ./DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/deepseek-r1-distill-qwen-1.5b-q4_0.gguf /root/.ollama/models/
设置环境变量
ENV OLLAMA_HOST=0.0.0.0
ENV OLLAMA_ORIGINS=*
暴露端口
EXPOSE 11434
启动命令
CMD [“/app/ollama/bin/ollama”, “serve”]

2.2 构建镜像
docker build -t ollama-deepseek:1.5b .
3.1 创建数据卷
docker volume create ollama-data
3.2 运行容器
docker run -d
–name ollama-deepseek
-p 11434:11434
-v ollama-data:/root/.ollama
–cpus 4 \ # 限制CPU使用
–memory 4g \ # 限制内存使用
ollama-deepseek:1.5b
–cpus 和memory 看具体情况是否加上
3.3容器运行成功,看下面离线文档:2.容器内操作
离线环境使用ollama部署DeepSeek模型。无GPU,CPU推理所以部署这个笨蛋
4.2 测试模型
构建的modelfile叫deepseek。
curl http://localhost:11434/api/generate -d ‘{
“model”: “deepseek”,
“prompt”: “你好,请介绍一下你自己”,
“stream”: false
}’
3. 监控和管理
5.1 查看日志
docker logs ollama-deepseek
5.2 查看资源使用
docker stats ollama-deepseek
5.3 重启容器
docker restart ollama-deepseek
4. 注意事项
5. 系统要求:
- 建议至少8GB内存
- CPU核心数建议4核以上
- 磁盘空间至少2GB
- 性能优化:
- 根据实际需求调整CPU和内存限制
- 可以通过环境变量调整Ollama配置
- 建议使用4-bit量化版本以节省资源
- 数据安全:
- 定期备份数据卷
- 监控系统资源使用情况
- 设置适当的访问权限
- 故障处理:
- 检查容器日志排查问题
- 确保端口未被占用
- 验证模型文件完整性
- 常见问题
- 模型加载失败:
- 检查模型文件路径
- 验证文件权限
- 确认磁盘空间充足
- 性能问题:
- 调整CPU和内存限制
- 检查系统资源使用情况
- 考虑使用更高性能的量化版本
- 连接问题:
- 验证端口是否开放
- 检查防火墙设置
- 确认容器运行状态
=============================================
PS:以下是LZ已经构建好的deepseek1.5基于ollama的镜像,上面是自定义模型构建的过程。
DeepSeek 1.5B 离线部署文档
- 镜像部署
1.1 加载镜像(文件获取看网盘)
docker load < ollama-deepseek-final.tar
1.2 运行容器
docker run -d
–name ollama-deepseek
-p 11434:11434
-v ollama-data:/root/.ollama
ollama-deepseek:1.5b
- 容器内操作
2.1 进入容器
docker exec -it ollama-deepseek bash
2.2 创建模型配置
创建目录
mkdir -p /root/.ollama/models/deepseek
cat > /root/.ollama/models/deepseek/Modelfile << ‘EOF’
FROM /root/.ollama/models/deepseek-r1-distill-qwen-1.5b-q4_0.gguf
PARAMETER temperature 0.7
PARAMETER num_ctx 4096
SYSTEM “”"
You are a helpful AI assistant.
“”"
EOF
2.3 创建模型
cd /root/.ollama/models/deepseek
ollama create deepseek -f Modelfile
ps:这里可自定义模型名称: create XXX -f Modelfile
2.4 验证模型
查看模型列表
ollama list
测试模型
ollama run deepseek “你好,请介绍一下你自己”
- API使用
3.1 使用curl测试
curl http://localhost:11434/api/generate -d ‘{
“model”: “deepseek”,
“prompt”: “你好,请介绍一下你自己”,
“stream”: false
}’

太笨了。
3.2 使用Python测试
import requests
response = requests.post(
‘http://localhost:11434/api/generate’,
json={
‘model’: ‘deepseek’,
‘prompt’: ‘你好,请介绍一下你自己’,
‘stream’: False
}
)
print(response.json())
- 维护命令
4.1 查看容器状态
docker ps
docker logs ollama-deepseek
4.2 重启容器
docker restart ollama-deepseek
4.3 查看资源使用
docker stats ollama-deepseek
-
注意事项
-
确保服务器有足够的内存(建议至少8GB)
-
模型文件位于 /root/.ollama/models/ 目录
-
服务运行在11434端口
-
可以通过环境变量调整配置
-
定期检查容器日志和资源使用情况
更多推荐

所有评论(0)