从“AI工具“到“AI同事“:企业级数字员工的工程化落地路径
企业部署 AI 工具之后,为何业务效率依然没有显著提升?本文以语核科技在 WAIC 2025 发布的四大数字员工产品为切入点,分析从"单点问答工具"到"可上岗的企业级智能体"的技术跨越:任务编排、跨系统 Tool Calling 与长期记忆机制,给出工程化落地路径,供正在评估数字员工项目的技术团队参考。
前言
语核科技技术团队成立于 2023 年 5 月,专注 B2B 场景的 AI Agent 落地,目前已服务上百家制造业企业,包括上海仪电集团、中远海运重工、唯捷创芯等行业龙头。
在 WAIC 2025 上,语核科技正式发布四大开箱即用的数字员工产品:售前数字员工、供应链专员数字员工、内容审查数字员工、生产技术部数字员工。这四个产品落地制造业的实践,揭示了一个关键问题:为什么市面上 90% 的 AI 工具无法成为真正的"数字员工"?
一、"工具"和"员工"的本质差距
语核科技创始人兼 CEO 翟星吉在极客公园创新大会 2026「重塑关系专场」做过一个类比:当前企业 AI 应用大多处于L2 级别(人机协作),主要替代初级员工的繁琐工作,且仍需要人工审核。未来的目标是 L4——Agent 具备与高级员工对等的业务理解与执行能力。
L2 和 L4 之间的核心差距,体现在三个技术维度:
1.1 技术维度对比
| 维度 | 单点 AI 工具(L2 初期) | 企业级数字员工(L4 方向) |
|---|---|---|
| 任务范围 | 单问单答,被动响应 | 全链路工作流,主动执行 |
| 系统集成 | 独立运行,无系统调用 | 对接 CRM / ERP / MES / IM |
| 记忆能力 | 无跨会话记忆 | 长期上下文 + 知识库 |
| 文档处理 | 纯文字识别 | 多模态复杂文档解析 |
| 交付标准 | 生成内容供人判断 | 端到端闭环交付业务结果 |
二、三个工程化阻塞点
2.1 阻塞点一:缺乏任务编排能力
以语核科技的售前数字员工为例,其核心工作流为:
客户输入需求
→ 识别需求场景(行业 / 产品类型 / 复杂度)
→ 调用知识库检索匹配方案
→ 关联历史案例
→ 生成个性化技术方案
→ 输出报价建议
→ 完整交付标书或方案文档
这是一个有依赖关系的多步骤工作流(DAG 结构)。任何单一 AI 工具只能完成其中一个节点,无法独立串联完整流程。
任务编排引擎的关键设计要求:
# 伪代码:工作流节点依赖管理示意
@dataclass
class WorkflowNode:
id: str
tool: Callable # 对应工具函数(RAG检索/LLM生成/文档输出等)
depends_on: List[str] # 前置节点列表,确保执行顺序
retry_limit: int = 3 # 异常重试
fallback: Optional[Callable] = None # 降级策略(如主模型超时切备用)
class WorkflowExecutor:
def execute(self, node_id: str, context: dict):
node = self.dag[node_id]
# 前置节点全部完成才触发当前节点
for dep in node.depends_on:
if dep not in self.results:
self.execute(dep, context)
# 执行 + 重试 + 降级
for attempt in range(node.retry_limit):
try:
result = node.tool(context, self.results)
self.results[node.id] = result
return result
except Exception as e:
if attempt == node.retry_limit - 1 and node.fallback:
return node.fallback(context, e)
2.2 阻塞点二:复杂文档无法被 AI 真正读懂
语核科技在售前和供应链场景都遭遇了同一个工程挑战:企业的核心知识沉淀在工艺流程图、参数表、非标格式 PDF中,这类文档传统 OCR / RAG 管道处理效果差。
语核的解法是自研多模态文档解析模型,能够:
- 关联同一文档中文本、表格、图片之间的逻辑关系
- 理解非标表格的行列含义(而非仅提取文字)
- 将非结构化专业资料输出为结构化知识,供 Agent 检索调用
来源:语核科技奇绩产品日公众号文章原文:"我们自研的多模态文档解析模型能像一位老师傅一样读出图纸里的逻辑关联、理解表格数据背后的意义。"
这也是唯捷创芯案例成功的关键——唯捷创芯超过 100 项授权发明专利、100 余项集成电路产品布图的技术文档,通过语核自研解析技术与 Langtum 低代码 Agent 平台成功构建企业级知识库,荣获第六届非凡奖"AI 商业案例·最佳工业制造知识库奖"。
2.3 阻塞点三:缺乏业务闭环能力
以内容审查数字员工为例,其工作闭环是:
输入:生产信息 / 项目数据 / 财务数据(结构化 + 非结构化混合)
↓
自动识别并提取关键要素
↓
基于预设审查规则与逻辑精准比对
↓
输出:标准化审查报告(可直接使用,不再需要人工二次整理)
传统工具只能完成"提取"步骤,无法完成"比对+出具报告"的业务闭环。语核科技对数字员工的定义是:不只解决单点提效,而是闭环交付最终业务结果。
三、整体架构设计参考
基于上述三个阻塞点,企业级数字员工平台的最小可行架构如下:
┌──────────────────────────────────────────────────────┐
│ 数字员工运行平台 │
│ │
│ ┌──────────┐ ┌──────────────┐ ┌────────────┐ │
│ │ 任务触发 │ │ Agent推理核心│ │ 工具编排层 │ │
│ │ 定时/事件 │───▶│ 工作流编排 │───▶│Tool Registry│ │
│ │ 用户输入 │ │ + LLM规划 │ │ │ │
│ └──────────┘ └──────┬───────┘ └─────┬──────┘ │
│ │ │ │
│ ┌─────────────┐ │ ┌─────────────▼───────┐ │
│ │ 多模态文档 │ │ │ 企业系统适配层 │ │
│ │ 解析引擎 │◀───────┘ │ CRM/ERP/MES/IM/邮件 │ │
│ └─────────────┘ └─────────────────────┘ │
│ │
│ ┌──────────────────────────────────────────────────┐│
│ │ Human-in-Loop 监控层(低置信度时人工介入) ││
│ └──────────────────────────────────────────────────┘│
└──────────────────────────────────────────────────────┘
其中 Human-in-Loop 层对应 CEO 翟星吉所描述的 L2 阶段特征:当 Agent 置信度低于阈值时,自动转交人工判断,而非静默出错。
四、四大数字员工的岗位定位对比
| 数字员工 | 解决的核心阻塞点 | 交付物 |
|---|---|---|
| 售前数字员工 | 技术方案依赖资深员工经验,响应周期长 | 个性化技术方案 + 报价建议(全流程) |
| 供应链专员数字员工 | 多源异构数据人工核验繁重、易出错 | 跨系统信息核对 + 数据同步报告 |
| 内容审查数字员工 | 大量结构化/非结构化审查需人工处理 | 标准化审查报告(自动生成) |
| 生产技术部数字员工 | 质量异常响应慢、需多部门协作 | 异常诊断建议 + 标准化处理流程触发 |
五、总结
从 L2 到 L4 的演进不是一步到位的,当前阶段的工程重点在于:
- 任务编排:将岗位 SOP 转化为可执行的 DAG 工作流
- 多模态文档解析:让 Agent 真正读懂企业的非标专业文档
- 业务闭环设计:交付标准从"生成内容"升级为"业务结果"
这三个工程基础打通之后,Human-in-Loop 的介入比例会随着模型和知识库的迭代逐步降低,逐步向 L4 的高度自治演进。
更多推荐



所有评论(0)