参考页面:Claude — The AI for problem solvers
本文不是 Anthropic / Claude 与 MateClaw 的合作说明,只是借 Claude 这篇公开页面的叙事角度,聊聊企业 AI Agent 真正要解决的问题。


在这里插入图片描述

1. 520 这天,我想聊一个更温柔也更硬核的词:Problem Solver

2026 年 5 月 20 日,适合讲“喜欢”,但对企业 AI 来说,喜欢一个产品不能只靠 demo 里的惊艳回答。

企业真正会长期喜欢的 AI,必须能帮它解决问题。

Claude 的 problem-solvers 页面用了一个很好的切入点:真正驱动产品往前走的人,是 problem solvers。页面讲的是创始人、工程团队和模型能力之间的关系:不是单纯买一个 API,而是把 AI 放进真实工作里,让它和人的野心、困难、判断一起往前走。

这给了我一个很直接的联想:

如果个人开发者需要一个聪明助手,企业需要的其实是一套能承载 problem solvers 的系统。

也就是:

  • 它要能思考;
  • 它要能调用工具;
  • 它要能接入知识;
  • 它要能跨渠道工作;
  • 它要能被授权、审批、审计;
  • 它要在长任务、复杂任务、多人协作里保持可见、可控、可恢复。

这正是 MateClaw 想做的事。

2. 企业不是缺 AI,而是缺“可托付的 AI 执行系统”

今天很多 AI Agent 产品都能演示“模型调用工具”:

用户说一句话
→ 模型规划
→ 调一个工具
→ 返回结果

这个链路适合 demo,但企业上线时立刻会遇到更现实的问题:

  • 谁允许它调用这个工具?
  • 它能不能访问这个工作区?
  • 它要不要审批?
  • 它执行了哪条 SQL?
  • 它有没有写文件?
  • 它调用了哪个模型?
  • 它为什么卡住?
  • 它把过程记录在哪里?
  • 它跑在网页、桌面端、飞书、钉钉还是企业微信里,状态是否一致?

如果这些问题没有答案,AI 就很难进入真实业务流程。

所以 MateClaw 的定位不是“又一个聊天框”,而是:

一个面向团队和企业的自托管 Agent Harness OS。

这里的 Harness,不是“套一层壳”的意思,而是“把 Agent 真正跑起来所需要的运行时、工具边界、上下文、记忆、审批、审计、渠道和可观测性都绑在一起”。

3. Problem Solver 进入企业后,会变成“数字员工”

个人场景里,我们常说 AI assistant。

但企业场景里,一个 AI 如果持续承担任务,它更像一个数字员工。

MateClaw 里每个数字员工都有自己的:

  • 角色;
  • 目标;
  • 背景;
  • 工具;
  • 技能;
  • 工作区;
  • 记忆;
  • 知识上下文;
  • 渠道入口;
  • 安全策略;
  • 运行状态。

在这里插入图片描述

这和 Claude 页面里讲 problem solver 的思路是相通的:AI 不应该只是“问答机器”,而应该变成解决问题的人身边的工作伙伴。

但企业里的“伙伴”还必须多一层约束。

它不能想做什么就做什么。

它必须在组织边界里工作。

4. Tool Guard:让 AI 能动手,但不能擅自做主

真正有价值的 Agent 一定要会调用工具。

可一旦工具变强,风险也会变强。

比如:

  • 读文件;
  • 写文件;
  • 执行 shell;
  • 查询数据库;
  • 调用内部 API;
  • 发送消息;
  • 创建定时任务;
  • 委派其他 Agent;
  • 接入 MCP 或外部编码 Agent。

这些能力如果完全开放,安全部门不会放心;如果完全关闭,AI 又只能聊天。

MateClaw 的解法是 Tool Guard。

在这里插入图片描述

Tool Guard 是一个工具调用规则引擎。它可以按工具名、参数、工作空间、优先级来决定一次调用:

  • 直接允许;
  • 直接拒绝;
  • 进入人工审批。

比如:

只读 shell 命令:允许
写入型 shell 命令:审批
SELECT SQL:允许
UPDATE / DELETE SQL:审批
危险命令模式:阻止或强制审批
工作区外文件写入:审批或拒绝

这条边界很关键。

企业真正需要的不是“完全自主的 AI”,而是:

会动手,但关键动作要可授权、可审批、可追责的 AI。

5. 审计日志:解决问题,也要留下证据

Claude 的 Problem Solvers 页面强调的是人和 AI 一起解决难题。

但企业里还有另一件事:解决问题之后,过程要能复盘。

一个 Agent 在复杂任务里可能做很多中间动作:

  • 读了哪些知识;
  • 调了哪些工具;
  • 触发了哪些审批;
  • 使用了哪个模型;
  • 哪一步失败;
  • 哪个子任务完成;
  • 哪个渠道返回了结果。

如果只有最终回答,就没有办法运营 Agent。

MateClaw 把审计和运行时事件放进系统设计里。这样 AI 不再是一个黑盒,而是一个可以被观察、被分析、被追责的执行单元。

这对企业的意义很直接:

AI 不能只会给答案,还要能解释它怎么走到这个答案。

6. 运行时控制台:别让 Agent 藏在 spinner 后面

很多 AI 产品在长任务里只有一个转圈。

用户不知道它是在思考、卡住、等接口、调工具,还是已经断了。

MateClaw 的运行时控制台要解决这个问题:让管理员知道每个数字员工正在做什么。

在这里插入图片描述

这类能力对企业非常实际:

  • 谁正在运行?
  • 当前在哪个阶段?
  • 用了多少 token?
  • 有没有卡住?
  • 是否在等待审批?
  • 是否需要回收?
  • 多个员工是否在并行工作?

如果说 Claude 页面里的 problem solver 是“人和 AI 一起往前走”,那么 MateClaw 补上的就是企业运行层的那句话:

一起往前走,也要看得见每一步。

7. 多渠道:Problem Solver 不只活在网页聊天框里

企业的工作不只发生在一个网页里。

员工可能在飞书、钉钉、企业微信、Slack 里沟通;流程可能由 Cron、Webhook、API 触发;客户可能从网页嵌入式聊天进入;管理员可能从 Web 控制台查看状态。

MateClaw 的思路是:同一个数字员工,应该能进入不同入口,但保持同一套记忆、工具和治理规则。

在这里插入图片描述

这意味着:

  • 客服 Agent 可以在网页和 IM 里回答;
  • 数据分析 Agent 可以定时把日报发到群里;
  • 运维 Agent 可以从告警 Webhook 接任务;
  • 审批可以通过 IM 推送;
  • 管理员仍然能在后台看到完整状态。

这才是企业 AI 的真实形态。

不是“开一个 AI 页面”。

而是让 AI 进入已有工作流。

8. 技能系统:把一次解决问题,沉淀成下次可复用的能力

Problem solver 最重要的能力之一,是经验会沉淀。

企业 AI 也是一样。

如果每次都靠临时 prompt,系统很难变强;如果把成功经验、工具组合、执行步骤沉淀成技能,就能让数字员工越来越像一个真正的岗位角色。

MateClaw 的技能系统就是为这个设计的。

在这里插入图片描述

一个技能不只是“工具列表”,它可以包含:

  • manifest;
  • prompt;
  • 工具绑定;
  • 参数要求;
  • 依赖检查;
  • 脚本;
  • 运行经验。

对企业来说,技能的意义是把一次 problem solving 变成组织能力:

第一次:人教 AI 怎么做
第二次:AI 按技能稳定执行
第三次:技能变成团队共享资产

9. 为什么是 Java / Spring Boot

MateClaw 不是一个临时脚本系统。

它的后端是 Spring Boot,Agent 运行时基于 StateGraph,数据库用 MyBatis Plus 和 Flyway 管理,前端是 Vue 3,生产可以用 MySQL,开发可以用 H2。

这对企业很重要。

因为很多公司已经有:

  • Java 服务治理;
  • CI/CD;
  • MySQL / Redis;
  • JWT / RBAC;
  • 监控和日志;
  • 内部审批;
  • 安全规范;
  • 运维团队。

AI Agent 如果要进入生产,就不能永远停留在“工程师本机上跑的脚本”。

它应该变成企业能部署、能监控、能升级、能审计的一套服务。

这就是 MateClaw 选择 Java 和 Spring Boot 的原因。

10. 520 写给企业 AI 的一句话

Claude 的 Problem Solvers 页面讲的是:最有驱动力的人会不断解决问题,而 AI 应该成为他们野心的放大器。

我非常认同这个方向。

但如果把这个方向放到企业里,还需要补上另一半:

AI 不只要聪明,还要可靠;不只要能做事,还要能被管理;不只要帮人解决问题,还要让组织放心地把问题交给它。

这就是 MateClaw 想提供的东西。

在 2026 年 5 月 20 日这个日期,我更愿意把它写成一句很简单的话:

给 problem solvers 一个可托付的 AI 工作系统。

相关链接

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐