1.1 下载模型
在有网络的环境下下载DeepSeek 1.5B的GGUF格式模型,资源足够的话,理论上你想部署啥就部署啥模型:
推荐去hugginface下载或者魔搭:
这里我是魔搭下载的量化版:https://modelscope.cn/models/ggml-org/DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/files
下载ubuntu官方镜像:docker pull ubuntu:22.04
下载ollama:https://github.com/ollama/ollama/releases
ollama-linux-amd64.tgz
解压成ollama-linux-amd64。
1.2 服务器创建目录
mkdir -p ollama/models
2. Docker配置
2.1 创建Dockerfile

使用官方Ollama镜像作为基础

FROM ubuntu:22.04

安装必要的依赖

RUN apt-get update && apt-get install -y
curl
wget
&& rm -rf /var/lib/apt/lists/*

创建工作目录

WORKDIR /app

复制整个Ollama目录

COPY ollama-linux-amd64 /app/ollama

# 设置权限

RUN chmod +x /app/ollama/bin/ollama

# 设置库文件路径

ENV LD_LIBRARY_PATH=/app/ollama/lib:LDLIBRARYPATHENVPATH=/app/ollama/bin:LD_LIBRARY_PATH ENV PATH=/app/ollama/bin:LDLIBRARYPATHENVPATH=/app/ollama/bin:PATH

复制模型文件到容器中

COPY ./DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/deepseek-r1-distill-qwen-1.5b-q4_0.gguf /root/.ollama/models/

设置环境变量

ENV OLLAMA_HOST=0.0.0.0
ENV OLLAMA_ORIGINS=*

暴露端口

EXPOSE 11434

启动命令

CMD [“/app/ollama/bin/ollama”, “serve”]

在这里插入图片描述

2.2 构建镜像
docker build -t ollama-deepseek:1.5b .
3.1 创建数据卷
docker volume create ollama-data
3.2 运行容器
docker run -d
–name ollama-deepseek
-p 11434:11434
-v ollama-data:/root/.ollama
–cpus 4 \ # 限制CPU使用
–memory 4g \ # 限制内存使用
ollama-deepseek:1.5b

–cpus 和memory 看具体情况是否加上

3.3容器运行成功,看下面离线文档:2.容器内操作
离线环境使用ollama部署DeepSeek模型。无GPU,CPU推理所以部署这个笨蛋
4.2 测试模型
构建的modelfile叫deepseek。
curl http://localhost:11434/api/generate -d ‘{
“model”: “deepseek”,
“prompt”: “你好,请介绍一下你自己”,
“stream”: false
}’
3. 监控和管理
5.1 查看日志
docker logs ollama-deepseek
5.2 查看资源使用
docker stats ollama-deepseek
5.3 重启容器
docker restart ollama-deepseek
4. 注意事项
5. 系统要求:

  • 建议至少8GB内存
  • CPU核心数建议4核以上
  • 磁盘空间至少2GB
  1. 性能优化:
  • 根据实际需求调整CPU和内存限制
  • 可以通过环境变量调整Ollama配置
  • 建议使用4-bit量化版本以节省资源
  1. 数据安全:
  • 定期备份数据卷
  • 监控系统资源使用情况
  • 设置适当的访问权限
  1. 故障处理:
  • 检查容器日志排查问题
  • 确保端口未被占用
  • 验证模型文件完整性
  1. 常见问题
  2. 模型加载失败:
  • 检查模型文件路径
  • 验证文件权限
  • 确认磁盘空间充足
  1. 性能问题:
  • 调整CPU和内存限制
  • 检查系统资源使用情况
  • 考虑使用更高性能的量化版本
  1. 连接问题:
  • 验证端口是否开放
  • 检查防火墙设置
  • 确认容器运行状态

=============================================
PS:以下是LZ已经构建好的deepseek1.5基于ollama的镜像,上面是自定义模型构建的过程。
DeepSeek 1.5B 离线部署文档

  1. 镜像部署

1.1 加载镜像(文件获取看网盘)
docker load < ollama-deepseek-final.tar

1.2 运行容器
docker run -d
–name ollama-deepseek
-p 11434:11434
-v ollama-data:/root/.ollama
ollama-deepseek:1.5b

  1. 容器内操作

2.1 进入容器
docker exec -it ollama-deepseek bash

2.2 创建模型配置

创建目录

mkdir -p /root/.ollama/models/deepseek

cat > /root/.ollama/models/deepseek/Modelfile << ‘EOF’
FROM /root/.ollama/models/deepseek-r1-distill-qwen-1.5b-q4_0.gguf

PARAMETER temperature 0.7
PARAMETER num_ctx 4096

SYSTEM “”"
You are a helpful AI assistant.
“”"
EOF

2.3 创建模型
cd /root/.ollama/models/deepseek
ollama create deepseek -f Modelfile
ps:这里可自定义模型名称: create XXX -f Modelfile
2.4 验证模型

查看模型列表

ollama list

测试模型

ollama run deepseek “你好,请介绍一下你自己”

  1. API使用

3.1 使用curl测试
curl http://localhost:11434/api/generate -d ‘{
“model”: “deepseek”,
“prompt”: “你好,请介绍一下你自己”,
“stream”: false
}’

在这里插入图片描述

太笨了。
3.2 使用Python测试
import requests

response = requests.post(
‘http://localhost:11434/api/generate’,
json={
‘model’: ‘deepseek’,
‘prompt’: ‘你好,请介绍一下你自己’,
‘stream’: False
}
)
print(response.json())

  1. 维护命令

4.1 查看容器状态
docker ps
docker logs ollama-deepseek

4.2 重启容器
docker restart ollama-deepseek

4.3 查看资源使用
docker stats ollama-deepseek

  1. 注意事项

  2. 确保服务器有足够的内存(建议至少8GB)

  3. 模型文件位于 /root/.ollama/models/ 目录

  4. 服务运行在11434端口

  5. 可以通过环境变量调整配置

  6. 定期检查容器日志和资源使用情况

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐