【2025年5月】AI生产力再探再报：各家智能体持续内卷，前沿应用不断细分

扣子空间、纳米AI超级搜索、Qwen3研究分析...6大AI比拼；MCPo、A2A...智能体框架再上一层楼！

Seon塞翁

1792人浏览 · 2025-06-02 00:36:58

Seon塞翁 · 2025-06-02 00:36:58 发布

前言
2025年5月的个人学习笔记。

一、工具尝鲜快报：初探感觉好玩，但还未深入的工具。
二、生产力军火库：开箱即用的神器，以及一些好用的技巧。
三、前沿动态速递：一些可反复品读的优质资料和个人感兴趣的新工具。

一、工具探索快报

本月加班太多，空余时间没有探索什么工具，用扣子空间实现了一些简单需求，体验了一把通用智能体。底层模型是豆包和 DeepSeek，相当于是升级版自动化工作流的豆包？在 H5 简历制作、大学生数据库实训作业上的表现不错，6月再抽空深入挖掘一下。

prompt：根据文档中的要求开发数据库系统
一、设计一个面向校园共享资源（如自习室、会议室、运动场地、实验室设备等）的管理数据库
1.设计两类用户：管理员（管理公共资源数据库）、普通用户（学生/教师）
2.公共资源管理：公共资源类别、位置、名称、可用状态等
3.预约管理：按时间段预约公共资源（支持按小时预约），预约冲突检测（同一实验室同一时间段不可重复预约），查看自身的个人预约记录。此外，有些公共资源，如自习室，在学期一开始就会安排一些固定的课程，如：XX课程就会一直在每周固定时间段占用XX自习室，这些也需要考虑进去。
4.分类查询：管理员可以查看借用资源的用户详细信息，如：联系电话，邮箱等，普通用户只能查看占用情况，出于个人隐私保护，无法查询用户详细信息。
5.绘制ER图，创建相关的关系表
6.提供管理该数据库所需的sql语句（相应的增删改查语句）
二、需要做出来的东西
1.提供可运行并演示的数据库demo程序（能在mysql上运行），初步解决该共享资源管理问题，能够支持基本的查询，如：预约查询；能够支持基本的预约操作等
2.数据库的ER图设计文档
3.并发控制封锁机制、安全权限机制、SQL扩展功能等
4.设计报告：对代码和相应的功能进行说明的文档

以下，用其他 5 个类似产品和扣子空间对比了一下数据库作业的实现。

AI	文档设计	ER图	尝试执行代码
扣子空间	详尽	√	√
纳米AI超级搜索	详尽	√	√
Qwen3分析研究	详尽
Kimi长思考	简略
AutoGLM沉思	详尽
文心X1 Turbo	简略		√

1.扣子空间

交付内容还算齐全，不仅有详细的设计文档，还用 python 尝试执行了数据库创建，要求是用 mysql，不过运行空间里没有相关环境，在线创建失败。总体感觉还是很丝滑的，执行大约 5~10 分钟（自身没有计时显示），交互界面也很舒服，易上手。似乎没有任务数限制，单个任务中生成文件不超过 300 个。
在这里插入图片描述

2.纳米AI超级搜索

交付内容齐全，同样无法在线建库，中间输出了交互网页，但比较鸡肋，最终的设计文档内容比较混乱，不易于理解。耗时 17 分钟，官方在最后也提示还在公测，每天 10 次体验也是完全足够用的。
在这里插入图片描述

3.Qwen3分析研究

总体设计比较完善，质量较好，但 ER 图的需求没有实现。耗时 7.5 分钟，每月 20 次体验。
在这里插入图片描述

4.Kimi长思考

大模型基操，推理后快速输出了干练的方案，但只是方案，达不到直接交付的要求，也缺少 ER 图。
在这里插入图片描述

5.AutoGLM沉思

相比 KIMI 一次性思考后输出，进行了多轮思考，还去搜索了外部资料，输出的方案更加详尽，但仍缺少 ER 图。
在这里插入图片描述

6.文心X1 Turbo

扣子空间和纳米都具有沙箱所以尝试了在线建库，文心也调用解释器进行了多次尝试（通义也有代码模式，但不能和分析研究模式同时开启），它们都无法马上意识到自己是因缺少 mysql 环境才失败的。最终文心称自己达到了最大思考轮数，中止试验进行了输出，方案和 KIMI 一样比较干练，但思考过程还是很有意思的。
在这里插入图片描述

二、生产力军火库

1.AMiner

科研神器，AI 赋能科技情报挖掘-学术搜索-论文检索-论文专利-文献追踪-学者画像。
地址：https://www.aminer.cn/
在这里插入图片描述

2.Make

超强的自动化编排工具，在国内似乎少有提及，也没有能匹敌的产品。
地址：https://www.make.com/en
在这里插入图片描述

3.Prompt Engineering Guide

虽然 prompt 工程师不再像最初一样大热，但基本的提示词设计理念还是值得学习的，这是一个不错的指南。
地址：https://www.promptingguide.ai/zh
在这里插入图片描述

4.AI Short

即便不学习，也可以轻易找到前人积累的优质提示词，一个提示词集合站。
地址：https://www.aishort.top/
在这里插入图片描述

三、前沿动态速递

1.OpenWebUI MCPo

OpenWebUI 推出的进一步简化 MCP 连接的工具，能够将任何基于 MCP 协议的工具转换为兼容 OpenAPI 的 HTTP 服务器。使个人开发需要调用工具的 AI 应用时更加快捷，也可以不编码而快速集成到 Open WebUI 中使用。对普通用户而言，用各大厂商的在线服务更好，但有定制化需求或本地化应用时，可以了解一下这个。
地址：https://github.com/open-webui/mcpo

2.Google A2A

Google 表示其是对 MCP 的补充，MCP 连接工具，而 A2A 连接 Agent （每个 Agent 可能有自己的 MCP ）。工作流程：Agent 发现 → 任务委派 → 监控执行 → 结果整合。简单来说是用于开发多智能体协作应用的，非开发者知道有这个东西就行。拿做菜来说，一个 LLM 做的是想出一个菜谱，一个 MCP 做的是用锅加水煮，一个 Agent 做的是按菜谱去买菜回来做，而 A2A 做的是知道有哪些 Agent 能做什么事情、派谁去买菜、派谁去做菜、派谁来摆盘上菜。

核心差异	MCP（How？）	A2A（What？）
通信方式	输入、输出均是结构化数据	主要使用自然语言
任务处理	本质是一次性的函数调用	管理完整的生命周期
定义描述	精确的函数规格，JSON 格式	Agent Card，类似专家简历
应用场景	精细化的标准任务	模糊而复杂的需求

地址：https://github.com/google-a2a/A2A

3.DeepAgent

‌ Abacus AI 推出，如果说前两项是给开发者用的，那么这个产品就是直达用户的，只需表达需求，它会自动调度 N 种大模型、附带 N 种工具，完成最接近可交付物而无需再次加工的输出。不过自 Manus 造势以来，几乎所有的通用智能体产品都想表明自己是最通用、最智能的，DeepAgent 每月 10 刀（Manus 19 刀），会不会比免费的扣子空间表现更好呢？

4.Suna

Kortix AI 开源，复刻 Manus 的通用智能体，类似开源的 OpenManus，本地部署略繁琐，据说表现超过 100% 的 Manus。或许是 Manus 吃相太难看，打它脸的开源项目似乎越来越多（Suna 即 anus 倒着写），见此景也是乐哉。
地址：https://github.com/kortix-ai/suna

5.DeerFlow

字节跳动开源的深度研究框架，类似 DeepResearch。话说字节开源的几个工具都很有意思，却还没见到可以直接用的产品呢，比起白嫖技术底座，还是更想白嫖傻瓜应用啊。
地址：https://github.com/cccZone/deer-flow

6.Docling

IBM 开源的支持视觉大模型的 PDF 解析工具，可用来强化知识库的构建。
地址：https://github.com/docling-project

7.Qwen系列

通义一直都很积极，技术雄厚，不断推出新产品，备受好评。但仍要点名批评通义官网的用户体验极差，网站产品经理要拖出去打靶。另外像 DeepSeek、Claude、Gemini、Mistral 等各家大小模型和相关产品线的更新，也是遭受一发布即颠覆的鼓吹，看的有些精神疲劳，您们就继续卷吧，益街坊。
地址：https://modelscope.cn/organization/Qwen?tab=model