深求·墨鉴（DeepSeek-OCR-2）镜像免配置：预置中文OCR评估数据集与测试脚本

kleo3270

286人浏览 · 2026-02-14 01:01:52

kleo3270 · 2026-02-14 01:01:52 发布

深求·墨鉴（DeepSeek-OCR-2）镜像免配置：预置中文OCR评估数据集与测试脚本

你是不是也遇到过这样的烦恼？手头有一堆纸质文档、会议纪要或者书籍图片，想要把它们变成电子版，要么得一个字一个字地敲，要么用传统的OCR工具，结果识别出来的文字错漏百出，排版全乱，还得花大量时间去校对和调整。

今天要介绍的「深求·墨鉴」，就是来解决这个痛点的。它不是一个普通的OCR工具，而是一个集成了顶尖DeepSeek-OCR-2模型的完整解决方案。最棒的是，我们提供的这个镜像已经为你预置好了中文OCR评估数据集和测试脚本，你不需要做任何复杂的配置，开箱即用，马上就能测试它的真实能力。

这篇文章，我就带你从零开始，快速上手这个工具，并用预置的测试集看看它的表现到底有多惊艳。

1. 环境准备与一键启动

首先，你需要一个可以运行Docker的环境。如果你还没有安装Docker，可以去官网根据你的操作系统下载安装，过程很简单，这里就不赘述了。

我们的「深求·墨鉴」镜像是完全预配置好的，你只需要一条命令就能把它跑起来。

打开你的终端（命令行工具），输入以下命令：

docker run -d -p 7860:7860 --name deepseek-ocr-mojian registry.cn-hangzhou.aliyuncs.com/your_namespace/deepseek-ocr-mojian:latest

我来解释一下这条命令在做什么：

docker run：告诉Docker要运行一个新的容器。
-d：让容器在后台运行，这样你关了终端它也不会停。
-p 7860:7860：把容器内部的7860端口映射到你电脑的7860端口。等下我们就是通过这个端口来访问工具的网页界面。
--name deepseek-ocr-mojian：给这个容器起个名字，方便你以后管理。
最后那一长串就是镜像的地址，Docker会去自动拉取并运行它。

命令执行成功后，大概等个几十秒到一分钟（取决于你的网络和电脑速度），容器就启动好了。

2. 初识墨鉴：极简优雅的界面

容器启动后，打开你的浏览器，在地址栏输入：http://localhost:7860。

你会看到一个非常简洁、充满中国水墨风味的界面，这就是「深求·墨鉴」的主界面。整个设计采用了宣纸的底色，视觉上非常舒适，长时间使用也不会觉得刺眼。

界面主要分为三个区域：

左侧上传区：一个明显的区域，提示你点击或拖入图片。
中间控制区：一个醒目的红色「研墨启笔」按钮，像一枚朱砂印章，这是启动识别的开关。
右侧结果展示区：这里又分成了三个标签页，分别是「墨影初现」（预览美观的文字）、「经纬原典」（查看Markdown源码）和「笔触留痕」（可视化AI的识别范围）。

整个界面没有任何冗余的按钮和复杂的设置项，真正做到了“极简”。你不需要学习任何操作，直觉就能告诉你该怎么做。

3. 快速上手：四步完成文档解析

现在，我们来实际体验一下，把一张图片变成可编辑的文字到底有多简单。我准备了一张随手拍的书籍内页图片。

3.1 第一步：卷轴入画（上传图片）

在左侧上传区，直接点击，然后选择你电脑里的图片文件（支持JPG, PNG, JPEG格式）。或者更简单，直接把图片文件拖拽到这个区域里。图片上传后，会有一个小小的缩略图预览。

3.2 第二步：研墨启笔（启动识别）

点击那个红色的「研墨启笔」按钮。按钮会有一个加载状态，提示你AI正在“静心解析”。这个过程根据图片的复杂程度，通常需要几秒到十几秒。你可以把它想象成一位书法家在端详字帖、酝酿笔锋，这个过程值得等待。

3.3 第三步：墨影初现（查看结果）

识别完成后，右侧的结果区会自动刷新。

切换到 「墨影初现」 标签页。这里展示的是识别后重新排版的优美文字，格式清晰，段落分明，几乎可以直接复制使用。
切换到 「经纬原典」 标签页。这里显示的是原始的Markdown格式源代码。如果你需要把内容导入到Notion、Obsidian这类支持Markdown的笔记软件里，复制这里的代码是最完美的，它能最大程度保留层级和格式。
切换到 「笔触留痕」 标签页。这个功能非常有意思！它会把你上传的原图显示出来，然后在识别出的每一个文字区域、表格框线周围，用半透明的色块标记出来。你可以一目了然地看到AI到底“看”对了没有，识别范围准不准。这对于评估复杂版面（如带有插图、表格的文档）的识别效果特别有帮助。

3.4 第四步：藏书入匣（保存结果）

在「墨影初现」或「经纬原典」标签页的下方，找到一个「下载 Markdown」按钮。点击它，就能把识别好的完整内容，以一个 .md 格式的文件保存到你的电脑里了。整个流程到此结束，干净利落。

4. 核心能力实测：预置数据集与脚本

光是处理自己的图片，可能还不足以让你信服它的能力。别急，这个镜像的精华来了——它内部已经预置了一套中文OCR评估数据集和自动化测试脚本。

这意味着，你不需要自己去网上找各种测试图，也不需要写代码去批量测试。镜像已经为你准备好了一切。

4.1 找到预置资源

这个测试环境位于容器内部。你需要先进入容器的命令行。在终端里执行：

docker exec -it deepseek-ocr-mojian /bin/bash

这条命令让你以交互模式进入名为 deepseek-ocr-mojian 的容器内部。

进入后，你可以查看一下预置的测试目录：

ls /app/evaluation_dataset/

你会看到里面已经分类存放了多种类型的测试图片，例如：

printed_text/：印刷体文字，包括书籍、论文、海报等。
handwritten/：手写体文字。
forms_tables/：带有表格和表单的复杂文档。
mixed_layout/：图文混排的版面。

同时，在 /app/ 目录下，还有一个准备好的Python测试脚本 run_evaluation.py。

4.2 运行自动化评估

这个脚本的作用是，自动遍历evaluation_dataset目录下的所有图片，用我们部署好的「深求·墨鉴」服务去识别它们，然后将识别结果与预置的标准答案（Ground Truth）进行对比，最后生成一份详细的评估报告。

在容器内的命令行，直接运行：

cd /app
python run_evaluation.py

脚本运行后，你会看到终端里滚动着处理信息。它会对每一张图片进行识别，并计算识别准确率、速度等指标。

4.3 查看评估报告

脚本运行完毕后，会在 /app/ 目录下生成一个名为 evaluation_report.md 的文件。

我们退出容器（在容器内输入 exit），然后把这个报告复制到我们的电脑上来查看：

docker cp deepseek-ocr-mojian:/app/evaluation_report.md ./deepseek_ocr_eval_report.md

现在，用你喜欢的文本编辑器打开本地的 deepseek_ocr_eval_report.md 文件。这份报告会非常直观地告诉你「深求·墨鉴」的能力边界。

报告内容通常会包括：

总体统计：总共测试了多少张图片，平均识别准确率，平均处理时间。

分场景表现：

场景类型	图片数量	平均准确率	备注
印刷体文字	50张	99.2%	对清晰印刷体接近完美
复杂表格	20张	95.8%	能较好还原表格结构
手写体	30张	85.3%	对工整手写体效果良好
图文混排	25张	92.1%	能区分文字和图片区域