手把手教学：DeepSeek-R1-Distill-Qwen-7B在Open WebUI中的使用

一筐猪的头发丝

366人浏览 · 2026-02-13 00:38:36

一筐猪的头发丝 · 2026-02-13 00:38:36 发布

手把手教学：DeepSeek-R1-Distill-Qwen-7B在Open WebUI中的使用

如果你正在寻找一个推理能力强、部署简单、效果惊艳的开源大模型，那么DeepSeek-R1-Distill-Qwen-7B绝对值得你花时间了解一下。这个模型在数学、代码和逻辑推理任务上的表现相当出色，而且通过Ollama和Open WebUI的组合，你可以轻松地在本地搭建一个属于自己的AI助手。

今天我就带你一步步完成整个部署过程，从环境准备到实际使用，让你在30分钟内就能开始和这个强大的推理模型对话。

1. 准备工作：你需要什么

在开始之前，我们先看看需要准备哪些东西。整个过程其实很简单，就像搭积木一样，把几个组件组合起来就行。

1.1 硬件和软件要求

硬件要求：

内存：至少16GB RAM（7B模型本身需要约8GB，加上系统开销）
存储空间：10GB以上可用空间
显卡：有独立显卡更好（能加速推理），但CPU也能运行

软件要求：

操作系统：Windows 10/11、macOS 10.15+、Linux（Ubuntu 20.04+推荐）
Docker Desktop（用于运行Open WebUI）
终端或命令行工具

1.2 了解DeepSeek-R1-Distill-Qwen-7B

简单来说，DeepSeek-R1-Distill-Qwen-7B是一个专门为推理任务优化的模型。它有几个特点：

推理能力强：在数学题、代码编写、逻辑分析等任务上表现突出
思考过程可见：模型会展示它的推理步骤（CoT，Chain of Thought）
开源免费：完全开源，可以自由使用和部署
7B参数规模：相对较小，对硬件要求友好，但能力不减

这个模型是从更大的DeepSeek-R1模型蒸馏出来的，保留了核心的推理能力，同时大大减小了模型大小，让普通用户也能在本地运行。

2. 安装Ollama：模型运行引擎

Ollama是一个专门用于在本地运行大语言模型的工具，它简化了模型的下载、加载和运行过程。

2.1 下载和安装Ollama

访问官方网站：打开浏览器，访问 https://ollama.com
选择对应版本：
- Windows用户：点击"Download for Windows"
- macOS用户：点击"Download for macOS"
- Linux用户：根据你的发行版选择对应的安装方式
安装过程：
- Windows/macOS：下载后双击安装包，按照提示完成安装
- Linux：在终端中运行安装命令

安装完成后，你可以在终端或命令提示符中输入 ollama --version 来验证是否安装成功。

2.2 下载DeepSeek-R1-Distill-Qwen-7B模型

模型下载非常简单，只需要一条命令：

ollama run deepseek-r1:7b

当你第一次运行这个命令时，Ollama会自动：

从服务器下载模型文件（约4.7GB）
加载模型到内存
进入交互式对话模式

下载过程可能需要一些时间，取决于你的网络速度。下载完成后，你会看到类似这样的提示：

>>> Send a message (/? for help)

这时候你可以直接输入问题测试模型，比如输入"你好，介绍一下你自己"，看看模型的回复。

重要提示：如果你只是想下载模型而不立即使用，可以按 Ctrl+C 退出交互模式，模型文件已经保存在本地了。

3. 安装Docker：容器化运行环境

Docker是一个容器化平台，它能让Open WebUI应用在不同的系统上以相同的方式运行。

3.1 下载Docker Desktop

访问Docker官网：https://www.docker.com/products/docker-desktop
选择对应版本下载：
- Windows：Docker Desktop for Windows
- macOS：Docker Desktop for Mac
- Linux：根据发行版选择安装方式
安装步骤：
- 双击安装包，按照向导完成安装
- 安装完成后启动Docker Desktop
- 首次启动可能需要一些初始化时间

3.2 验证Docker安装

打开终端或命令提示符，输入：

docker --version

如果显示Docker版本信息，说明安装成功。再输入：

docker run hello-world

这个命令会下载一个测试镜像并运行，如果看到"Hello from Docker!"的消息，说明Docker工作正常。

4. 部署Open WebUI：友好的图形界面

Open WebUI（原名Ollama WebUI）是一个为Ollama模型提供Web界面的工具，它让模型的使用变得像ChatGPT一样简单直观。

4.1 一键部署Open WebUI

在终端中运行以下命令：

docker run -d -p 8080:8080 --add-host=host.docker.internal:host-gateway -e OLLAMA_BASE_URL=http://host.docker.internal:11434 --name open-webui ghcr.io/open-webui/open-webui:main

让我解释一下这个命令的各个部分：

-d：在后台运行容器
-p 8080:8080：将容器的8080端口映射到本机的8080端口
--add-host=host.docker.internal:host-gateway：添加主机名解析，让容器能访问主机服务
-e OLLAMA_BASE_URL=http://host.docker.internal:11434：设置Ollama服务的地址
--name open-webui：给容器起个名字
ghcr.io/open-webui/open-webui:main：使用的镜像地址

4.2 访问Open WebUI

部署完成后，打开浏览器，访问：http://localhost:8080

第一次访问时，你需要：

创建账户：输入用户名、邮箱和密码
登录系统：使用刚创建的账户登录
开始使用：登录后就能看到主界面了

如果一切正常，你会看到一个简洁的聊天界面，右上角有模型选择按钮。

5. 连接模型与WebUI：让它们对话

现在我们有三个组件在运行：

Ollama（运行着DeepSeek-R1模型）
Docker（运行着Open WebUI）
Open WebUI界面

我们需要让Open WebUI能找到Ollama中的模型。

5.1 在Open WebUI中添加模型

进入模型管理页面：
- 在Open WebUI界面中，点击右上角的设置图标（齿轮形状）
- 选择"模型"或"Models"选项
连接Ollama服务：
- 确保Ollama Base URL设置为：http://host.docker.internal:11434
- 这个地址是Docker容器访问主机服务的特殊地址
刷新模型列表：
- 点击"刷新"或"Refresh"按钮
- Open WebUI会自动检测Ollama中已下载的模型
选择DeepSeek-R1-Distill-Qwen-7B：
- 在模型列表中，你应该能看到"deepseek-r1:7b"
- 点击选择这个模型

5.2 验证连接是否成功

回到聊天界面，在输入框中输入一个简单的问题，比如：

请用一句话介绍你自己。

如果模型正常回复，说明所有组件都正确连接了。如果遇到问题，可以检查：

Ollama是否在运行：在终端输入 ollama list，应该能看到deepseek-r1:7b
Docker容器状态：输入 docker ps，应该能看到open-webui容器在运行
端口是否被占用：确保8080端口没有被其他程序使用

6. 使用技巧：让模型发挥最佳效果

DeepSeek-R1-Distill-Qwen-7B是一个推理型模型，使用得当能获得非常好的效果。这里分享一些实用技巧。

6.1 温度参数设置

温度（Temperature）控制模型输出的随机性：

太低（如0.1）：输出确定性高，可能重复
太高（如1.0）：输出随机性强，可能不连贯
推荐设置：0.5-0.7之间，0.6是个不错的选择

在Open WebUI中设置温度：

在聊天界面找到参数设置（通常是个滑块或输入框）
将温度设置为0.6
其他参数可以保持默认

6.2 强制模型展示思考过程

DeepSeek-R1系列模型的一个特点是会展示推理步骤，但有时候它会跳过。为了确保模型充分思考，可以在问题开头加上：

请思考这个问题，并展示你的推理步骤。

或者更直接地要求：

请以"<think>"开始你的思考。

例如，问数学题时可以这样：

请计算：一个长方形的长是8厘米，宽是5厘米，求它的面积和周长。请分步骤推理，并将最终答案放在\boxed{}中。

6.3 不同类型问题的提问技巧

数学问题：

问题：解方程 2x + 5 = 13
要求：请分步骤推理，展示每一步的计算过程，最后将答案放在\boxed{}中。

代码问题：

问题：用Python写一个函数，判断一个数是否为素数
要求：请先解释算法思路，再给出完整代码，并添加注释说明关键步骤。

逻辑推理：

问题：如果所有猫都怕水，而Tom是一只猫，那么Tom怕水吗？
要求：请用逻辑推理的方式分析这个问题，展示推理链条。

6.4 使用系统提示词（谨慎使用）

虽然文档建议不要添加系统级提示，但在某些情况下，适当的提示能改善效果。在Open WebUI中，你可以在"预设"或"Prompt"部分添加：

你是一个擅长数学和逻辑推理的助手。请仔细思考用户的问题，展示完整的推理过程，确保答案准确无误。

注意：不要过度使用系统提示，简单的用户指令通常效果更好。

7. 实际使用案例：看看模型能做什么

让我们通过几个实际例子，看看DeepSeek-R1-Distill-Qwen-7B在不同场景下的表现。

7.1 数学问题求解

用户输入：

请计算：一个圆柱体的底面半径是3厘米，高是10厘米，求它的体积和表面积。请分步骤推理，并将最终答案放在\boxed{}中。

模型回复示例：

<think>
已知圆柱体底面半径 r = 3 cm，高 h = 10 cm。

第一步：计算体积
圆柱体体积公式：V = πr²h
代入数值：V = π × 3² × 10 = π × 9 × 10 = 90π
取π ≈ 3.1416，则 V ≈ 90 × 3.1416 = 282.744 cm³

第二步：计算表面积
圆柱体表面积公式：S = 2πr² + 2πrh = 2πr(r + h)
代入数值：S = 2π × 3 × (3 + 10) = 2π × 3 × 13 = 78π
取π ≈ 3.1416，则 S ≈ 78 × 3.1416 = 244.9648 cm²

第三步：整理答案
体积约为282.74 cm³，表面积约为244.96 cm²。

</think>
体积：\boxed{282.74\ \text{cm}^3}，表面积：\boxed{244.96\ \text{cm}^2}

7.2 代码编写任务

用户输入：

用Python写一个函数，接收一个整数列表，返回列表中所有偶数的平方和。请先解释算法，再给出代码。

模型回复示例：

<think>
这个问题需要处理一个整数列表，筛选出偶数，计算每个偶数的平方，然后求和。

算法步骤：
1. 初始化一个变量用于存储总和，初始值为0
2. 遍历列表中的每个元素
3. 检查当前元素是否为偶数（能被2整除）
4. 如果是偶数，计算其平方并加到总和中
5. 遍历完成后返回总和

现在用Python实现这个算法。

def sum_of_even_squares(numbers):
    """
    计算整数列表中所有偶数的平方和
    
    参数:
    numbers -- 整数列表
    
    返回:
    所有偶数的平方和
    """
    total = 0  # 初始化总和
    
    for num in numbers:
        # 检查是否为偶数
        if num % 2 == 0:
            # 计算平方并累加
            total += num ** 2
    
    return total

# 测试示例
if __name__ == "__main__":
    test_list = [1, 2, 3, 4, 5, 6]
    result = sum_of_even_squares(test_list)
    print(f"列表 {test_list} 中偶数的平方和为: {result}")
    # 偶数: 2, 4, 6
    # 平方: 4, 16, 36
    # 总和: 56

函数已实现，时间复杂度为O(n)，空间复杂度为O(1)。

7.3 逻辑推理问题

用户输入：

三个人参加比赛：甲、乙、丙。已知：
1. 如果甲不是第一名，那么乙是第三名
2. 如果乙不是第三名，那么甲是第一名
3. 丙不是第一名
请问：甲、乙、丙的名次各是多少？请展示推理过程。

模型回复示例：

<think>
让我们用逻辑推理来分析这个问题。

设命题：
A：甲是第一名
B：乙是第三名
C：丙是第一名

已知条件：
1. 如果非A，则B  （¬A → B）
2. 如果非B，则A  （¬B → A）
3. 非C           （¬C）

从条件3可知，丙不是第一名，所以第一名只能是甲或乙。

现在分析条件1和2：
这两个条件实际上是等价的。因为 (¬A → B) 等价于 (A ∨ B)，而 (¬B → A) 也等价于 (B ∨ A)。

所以实际上条件1和2告诉我们：要么甲是第一名，要么乙是第三名，或者两者都成立。

考虑几种情况：
情况1：甲是第一名（A为真）
那么乙可以是任意名次，丙不是第一名（已知），所以可能的名次：甲1、乙2、丙3 或 甲1、乙3、丙2

情况2：乙是第三名（B为真）
那么甲可以是任意名次，丙不是第一名，所以可能的名次：甲1、乙3、丙2 或 甲2、乙3、丙1（但丙不能是第一名，所以排除）

检查一致性：
- 如果甲1、乙2、丙3：满足条件1（非A假，所以条件1自动真），满足条件2（非B真，所以A真，成立），满足条件3
- 如果甲1、乙3、丙2：同样满足所有条件
- 如果甲2、乙3、丙1：不满足条件3（丙不能是第一名）

但我们需要确定的名次，所以需要进一步推理。

注意到条件1和2实际上是说：A和B至少有一个为真。
如果A假（甲不是第一名），则B必须真（乙是第三名）。
如果B假（乙不是第三名），则A必须真（甲是第一名）。

现在结合丙不是第一名（条件3）。

假设甲不是第一名（A假），则乙必须是第三名（B真）。
那么第一名只能是乙或丙，但丙不是第一名，所以乙必须是第一名。
但乙又是第三名，矛盾。所以假设不成立。

因此，甲必须是第一名（A真）。
既然甲是第一名，丙不是第一名，那么丙只能是第二或第三名。
乙可以是第二或第三名。

但我们需要唯一解吗？题目可能有多解，或者需要进一步约束。

让我重新检查：如果甲是第一名，那么条件1自动满足（因为前件假），条件2也满足（因为后件真）。
丙不是第一名，成立。

所以可能的解：
1. 甲1、乙2、丙3
2. 甲1、乙3、丙2

但题目可能隐含了"名次各不相同"的假设，通常比赛名次是互不相同的。
如果名次各不相同，那么两种情况都满足。

但让我们看原题是否还有其他信息...题目只给了三个条件。

考虑到通常逻辑题会有唯一解，让我再仔细分析。

从条件1：如果甲不是第一名，那么乙是第三名。
从条件2：如果乙不是第三名，那么甲是第一名。

这两个条件等价于：甲是第一名 或 乙是第三名。

现在用反证法：假设乙不是第三名，那么根据条件2，甲必须是第一名。
假设甲不是第一名，那么根据条件1，乙必须是第三名。

所以实际上，甲和乙的名次是相关的：他们不能同时既不是第一名也不是第三名。

丙不是第一名，所以丙是第二或第三名。

考虑乙是第三名的情况：那么丙只能是第二名，甲是第一名。
考虑甲是第一名的情况：那么乙可以是第二或第三名，丙对应是第三或第二名。

所以确实有两种可能。

但也许题目默认名次各不相同，且每个人名次唯一。
那么两种可能：
1. 甲1、乙2、丙3
2. 甲1、乙3、丙2

都满足条件。

让我验证条件1：
情况1：甲1（不是"甲不是第一名"），所以条件1前件假，整个条件真。
情况2：甲1，同样条件1前件假，整个条件真。

条件2：
情况1：乙2（不是第三名），所以条件2前件真，需要后件真，甲是第一名，成立。
情况2：乙3（是第三名），条件2前件假，整个条件真。

条件3：丙都不是第一名，成立。

所以确实有两个可能解。

但通常逻辑题会有唯一解，让我看看是否漏了什么。

啊，我明白了！如果乙是第三名，那么根据条件1，当甲不是第一名时乙是第三名，但这里乙是第三名并不要求甲不是第一名。
实际上，从逻辑上，两个解都成立。

也许题目有印刷错误，或者需要额外假设。
但基于给定条件，有两个可能的名次排列。

</think>
根据给定条件，有两种可能的名次排列：
1. 甲第一名，乙第二名，丙第三名
2. 甲第一名，乙第三名，丙第二名

两种排列都满足所有条件。

8. 常见问题与解决方案

在部署和使用过程中，你可能会遇到一些问题。这里整理了一些常见问题和解决方法。

8.1 模型加载失败

问题：Open WebUI中看不到deepseek-r1:7b模型

解决方法：

确保Ollama正在运行：在终端输入 ollama list
检查模型是否已下载：ollama run deepseek-r1:7b 应该能启动模型
重启Open WebUI容器：docker restart open-webui
检查Open WebUI中的Ollama地址设置是否正确

8.2 模型响应慢

问题：模型生成回复速度很慢

解决方法：

检查硬件资源：确保有足够的内存和CPU资源
调整参数：减少max_tokens参数，限制生成长度
使用GPU加速：如果有NVIDIA显卡，可以安装CUDA版本的Ollama
关闭其他应用：释放系统资源

8.3 模型输出重复或无意义

问题：模型输出重复内容或没有逻辑的文本

解决方法：

调整温度参数：设置为0.6左右
添加重复惩罚：在Open WebUI中设置repetition_penalty为1.05-1.2
明确要求：在问题中指定"请避免重复内容"
使用更好的提示：要求模型"逐步推理"或"分点回答"

8.4 Docker端口冲突

问题：8080端口已被占用

解决方法：

更改端口映射：将命令中的-p 8080:8080改为-p 8081:8080，然后访问http://localhost:8081
查找占用程序：使用netstat -ano | findstr :8080（Windows）或lsof -i :8080（macOS/Linux）找到并关闭占用程序
使用其他端口：选择8081、8082等未被占用的端口

8.5 模型不展示思考过程

问题：模型直接输出答案，不显示" "思考过程

解决方法：

明确要求：在问题开头加上"请以' '开始你的思考"
使用系统提示：在Open WebUI的预设中添加"请展示推理过程"
调整问题表述：使用"请分步骤解答"、"请展示你的推理链条"等表述

9. 进阶使用：更多可能性

一旦熟悉了基本使用，你可以探索更多高级功能和应用场景。

9.1 批量处理任务

虽然Open WebUI主要是交互式界面，但你也可以用它处理批量任务。比如，准备一个问题列表，逐个提问并收集答案。

9.2 结合其他工具

DeepSeek-R1-Distill-Qwen-7B可以与其他工具结合：

文档分析：上传文档，让模型总结内容
代码审查：粘贴代码，让模型检查问题
学习辅导：作为数学、编程的学习助手

9.3 性能优化建议

如果发现性能不够理想，可以尝试：

量化版本：寻找4bit或8bit量化版本的模型，减少内存占用
GPU加速：使用支持CUDA的Ollama版本
模型裁剪：如果只用于特定任务，可以考虑裁剪模型

9.4 监控和日志

了解如何查看运行状态：

Ollama日志：ollama logs
Docker日志：docker logs open-webui
系统资源：使用任务管理器或htop查看资源使用情况

10. 总结与建议

通过今天的教程，你已经成功搭建了一个完整的本地AI推理环境。让我们回顾一下关键点：

10.1 部署流程回顾

整个部署过程可以总结为四个步骤：

安装Ollama：作为模型运行引擎
下载模型：获取DeepSeek-R1-Distill-Qwen-7B
安装Docker：提供容器化环境
部署Open WebUI：获得友好的图形界面

每个步骤都有相应的命令和验证方法，确保你能顺利完成。

10.2 模型使用心得

基于我的使用经验，DeepSeek-R1-Distill-Qwen-7B有几个突出特点：

推理能力强：在数学和逻辑问题上表现优异
思考过程透明：能看到模型的推理链条
响应速度合理：7B规模在普通硬件上也能流畅运行
开源免费：没有使用限制和费用

10.3 给新手的建议

如果你是第一次使用本地大模型，我有几个建议：

从简单开始：先问一些简单问题，熟悉界面和操作
耐心调试：如果效果不理想，调整参数或重新表述问题
保存成功案例：记录那些得到好回答的问题和设置
加入社区：遇到问题时，可以在相关论坛或社区寻求帮助

10.4 未来探索方向

一旦熟悉了基本使用，你可以尝试：

比较不同模型：试试其他7B规模的模型，对比效果
微调模型：如果有特定需求，可以考虑微调模型
集成到应用：通过API将模型集成到自己的应用中
探索边缘部署：在资源受限的设备上运行模型

DeepSeek-R1-Distill-Qwen-7B是一个很好的起点，它展示了当前开源模型在推理任务上的能力。随着技术的不断发展，我们有望看到更多优秀的模型出现，让AI技术更加普及和易用。

最重要的是，现在你已经拥有了一个随时可用的AI推理助手，无论是学习、工作还是娱乐，它都能为你提供帮助。开始你的探索之旅吧！

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

【花雕动手做】行空板 K10 系列实验之人工智能调用语音合成（TTS）模块

AI Agent技术社区

苏州企业AI Agent智能体从概念到落地：2026年开发者必须关注的技术范式与工程实践

AI Agent技术社区

工程实践｜Warp 的 Loop Engineering：Agent 如何自己改进 Skill？

AI Agent技术社区

所有评论(0)

查看更多评论

一筐猪的头发丝

@weixin_35752645

已为社区贡献28条内容

手把手教学：DeepSeek-R1-Distill-Qwen-7B在Open WebUI中的使用

一筐猪的头发丝

手把手教学：DeepSeek-R1-Distill-Qwen-7B在Open WebUI中的使用

1. 准备工作：你需要什么

1.1 硬件和软件要求

1.2 了解DeepSeek-R1-Distill-Qwen-7B

2. 安装Ollama：模型运行引擎

2.1 下载和安装Ollama

2.2 下载DeepSeek-R1-Distill-Qwen-7B模型

3. 安装Docker：容器化运行环境

3.1 下载Docker Desktop

3.2 验证Docker安装

4. 部署Open WebUI：友好的图形界面

4.1 一键部署Open WebUI

4.2 访问Open WebUI

5. 连接模型与WebUI：让它们对话

5.1 在Open WebUI中添加模型

5.2 验证连接是否成功

6. 使用技巧：让模型发挥最佳效果

6.1 温度参数设置

6.2 强制模型展示思考过程

6.3 不同类型问题的提问技巧

6.4 使用系统提示词（谨慎使用）

7. 实际使用案例：看看模型能做什么

7.1 数学问题求解

7.2 代码编写任务

7.3 逻辑推理问题

8. 常见问题与解决方案

8.1 模型加载失败

8.2 模型响应慢

8.3 模型输出重复或无意义

8.4 Docker端口冲突

8.5 模型不展示思考过程

9. 进阶使用：更多可能性

9.1 批量处理任务

9.2 结合其他工具

9.3 性能优化建议

9.4 监控和日志

10. 总结与建议

10.1 部署流程回顾

10.2 模型使用心得

10.3 给新手的建议

10.4 未来探索方向

所有评论(0)

温馨提示：您尚未绑定手机号

一筐猪的头发丝