【2025年5月】AI生产力再探再报:各家智能体持续内卷,前沿应用不断细分
扣子空间、纳米AI超级搜索、Qwen3研究分析...6大AI比拼;MCPo、A2A...智能体框架再上一层楼!
前言
2025年5月的个人学习笔记。
一、工具尝鲜快报:初探感觉好玩,但还未深入的工具。
二、生产力军火库:开箱即用的神器,以及一些好用的技巧。
三、前沿动态速递:一些可反复品读的优质资料和个人感兴趣的新工具。
文章目录
一、工具探索快报
本月加班太多,空余时间没有探索什么工具,用扣子空间实现了一些简单需求,体验了一把通用智能体。底层模型是豆包和 DeepSeek,相当于是升级版自动化工作流的豆包?在 H5 简历制作、大学生数据库实训作业上的表现不错,6月再抽空深入挖掘一下。
prompt:根据文档中的要求开发数据库系统
一、设计一个面向校园共享资源(如自习室、会议室、运动场地、实验室设备等)的管理数据库
1.设计两类用户:管理员(管理公共资源数据库)、普通用户(学生/教师)
2.公共资源管理:公共资源类别、位置、名称、可用状态等
3.预约管理:按时间段预约公共资源(支持按小时预约),预约冲突检测(同一实验室同一时间段不可重复预约),查看自身的个人预约记录。此外,有些公共资源,如自习室,在学期一开始就会安排一些固定的课程,如:XX课程就会一直在每周固定时间段占用XX自习室,这些也需要考虑进去。
4.分类查询:管理员可以查看借用资源的用户详细信息,如:联系电话,邮箱等,普通用户只能查看占用情况,出于个人隐私保护,无法查询用户详细信息。
5.绘制ER图,创建相关的关系表
6.提供管理该数据库所需的sql语句(相应的增删改查语句)
二、需要做出来的东西
1.提供可运行并演示的数据库demo程序(能在mysql上运行),初步解决该共享资源管理问题,能够支持基本的查询,如:预约查询;能够支持基本的预约操作等
2.数据库的ER图设计文档
3.并发控制封锁机制、安全权限机制、SQL扩展功能等
4.设计报告:对代码和相应的功能进行说明的文档
以下,用其他 5 个类似产品和扣子空间对比了一下数据库作业的实现。
AI | 文档设计 | ER图 | 尝试执行代码 |
---|---|---|---|
扣子空间 | 详尽 | √ | √ |
纳米AI超级搜索 | 详尽 | √ | √ |
Qwen3分析研究 | 详尽 | ||
Kimi长思考 | 简略 | ||
AutoGLM沉思 | 详尽 | ||
文心X1 Turbo | 简略 | √ |
1.扣子空间
交付内容还算齐全,不仅有详细的设计文档,还用 python 尝试执行了数据库创建,要求是用 mysql,不过运行空间里没有相关环境,在线创建失败。总体感觉还是很丝滑的,执行大约 5~10 分钟(自身没有计时显示),交互界面也很舒服,易上手。似乎没有任务数限制,单个任务中生成文件不超过 300 个。
2.纳米AI超级搜索
交付内容齐全,同样无法在线建库,中间输出了交互网页,但比较鸡肋,最终的设计文档内容比较混乱,不易于理解。耗时 17 分钟,官方在最后也提示还在公测,每天 10 次体验也是完全足够用的。
3.Qwen3分析研究
总体设计比较完善,质量较好,但 ER 图的需求没有实现。耗时 7.5 分钟,每月 20 次体验。
4.Kimi长思考
大模型基操,推理后快速输出了干练的方案,但只是方案,达不到直接交付的要求,也缺少 ER 图。
5.AutoGLM沉思
相比 KIMI 一次性思考后输出,进行了多轮思考,还去搜索了外部资料,输出的方案更加详尽,但仍缺少 ER 图。
6.文心X1 Turbo
扣子空间和纳米都具有沙箱所以尝试了在线建库,文心也调用解释器进行了多次尝试(通义也有代码模式,但不能和分析研究模式同时开启),它们都意识不到自己是因缺少 mysql 环境才失败的。最终文心称自己达到了最大思考轮数,中止试验进行了输出,方案和 KIMI 一样比较干练,但思考过程还是很有意思的。
二、生产力军火库
1.AMiner
科研神器,AI 赋能科技情报挖掘-学术搜索-论文检索-论文专利-文献追踪-学者画像。
地址:https://www.aminer.cn/
2.Make
超强的自动化编排工具,在国内似乎少有提及,也没有能匹敌的产品。
地址:https://www.make.com/en
3.Prompt Engineering Guide
虽然 prompt 工程师不再像最初一样大热,但基本的提示词设计理念还是值得学习的,这是一个不错的指南。
地址:https://www.promptingguide.ai/zh
4.AI Short
即便不学习,也可以轻易找到前人积累的优质提示词,一个提示词集合站。
地址:https://www.aishort.top/
三、前沿动态速递
1.Open WebUI MCPo
Open WebUI 推出的进一步简化 MCP 连接的工具,能够将任何基于 MCP 协议的工具转换为兼容 OpenAPI 的 HTTP 服务器。使个人开发需要调用工具的 AI 应用时更加快捷,也可以不编码而快速集成到 Open WebUI 中使用。对普通用户而言,用各大厂商的在线服务更好,但有定制化需求或本地化应用时,可以了解一下这个。
地址:https://github.com/open-webui/mcpo
2.Google A2A
Google 表示其是对 MCP 的补充,MCP 连接工具,而 A2A 连接 Agent (每个 Agent 可能有自己的 MCP )。工作流程:Agent 发现 → 任务委派 → 监控执行 → 结果整合
。简单来说是用于开发多智能体协作应用的,非开发者知道有这个东西就行。拿做菜来说,一个 LLM 做的是想出一个菜谱,一个 MCP 做的是用锅加水煮,一个 Agent 做的是按菜谱去买菜回来做,而 A2A 做的是知道有哪些 Agent 能做什么事情、派谁去买菜、派谁去做菜、派谁来上菜。
核心差异 | MCP(How?) | A2A(What?) |
---|---|---|
通信方式 | 输入、输出均是结构化数据 | 主要使用自然语言 |
任务处理 | 本质是一次性的函数调用 | 管理完整的生命周期 |
定义描述 | 精确的函数规格,JSON 格式 | Agent Card,类似专家简历 |
应用场景 | 精细化的标准任务 | 模糊而复杂的需求 |
地址:https://github.com/google-a2a/A2A
3.DeepAgent
Abacus AI 推出,如果说前两项是给开发者用的,那么这个产品就是直达用户的,只需表达需求,它会自动调度 N 种大模型、附带 N 种工具,完成最接近可交付物而无需再次加工的输出。不过自 Manus 造势以来,几乎所有的通用智能体产品都想表明自己是最通用、最智能的,DeepAgent 每月 10 刀(Manus 19 刀),会不会比免费的扣子空间表现更好呢?
4.Suna
Kortix AI 开源,复刻 Manus 的通用智能体,类似开源的 OpenManus,本地部署略繁琐,据说表现超过 100% 的 Manus。或许是 Manus 吃相太难看,打它脸的开源项目似乎越来越多(Suna 即 anus 倒着写),见此景也是乐哉。
地址:https://github.com/kortix-ai/suna
5.DeerFlow
字节跳动开源的深度研究框架,类似 DeepResearch。
地址:https://github.com/cccZone/deer-flow
6.Docling
IBM 开源的支持视觉大模型的 PDF 解析工具。
地址:https://github.com/docling-project
7.Qwen系列
很积极,技术雄厚,不断推出新产品,但仍要点名批评通义官网的用户体验极差,网站产品经理要拖出去打靶。另外像 DeepSeek、Claude、Gemini、Mistral 等各家大小模型和相关产品线的更新,也是遭受一发布即颠覆的鼓吹,看的有些精神疲劳,您们就继续卷吧,益街坊。
地址:https://modelscope.cn/organization/Qwen?tab=model
后记
这里是加班时感觉会猝死的 Seon塞翁,下一篇再见~
更多推荐
所有评论(0)