
ICLR‘24 大语言模型智能体最新研究进展丨多智能体篇
在大语言模型驱动下的自主智能体方面,作者所在团队发布了该领域的早期综述(见A Survey on LLM-based Autonomous Agents),并构建了用户行为分析领域中首个基于自主智能体的模拟环境RecAgent(见RUC-GSAI/YuLan-Rec),欢迎大家关注。目前多智能体的方法大多让智能体在静态框架交互来实现协作,这很依赖先验知识且缺少泛化性,本文提出构造一个策略性的智能体
在大语言模型驱动下的自主智能体方面,作者所在团队发布了该领域的早期综述(见A Survey on LLM-based Autonomous Agents),并构建了用户行为分析领域中首个基于自主智能体的模拟环境RecAgent(见RUC-GSAI/YuLan-Rec),欢迎大家关注。
基于大语言模型的智能体(LLM-based Agent)在近期得到了广泛关注。本文汇总了在ICLR’24提交的论文中,基于大语言模型的智能体相关的全部论文,并进行了分类汇总,共计98篇。
今天我们给大家分享的是「多智能体」主题的论文,共11篇。
Survey: https://github.com/Paitesanshi/LLM-Agent-Survey
Code: https://github.com/RUC-GSAI/YuLan-Rec
内容转载自:ICLR’24 大语言模型智能体最新研究进展丨智能体能力篇
1. AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors
本文提出了多智能体框架AgentVerse,实现在协作中,多智能体的群体性能优于个体性能之和。
链接:https://www.aminer.cn/pub/64e432c73fda6d7f0600b8cd/?f=cs
2. AutoAgents: A Framework for Automatic Agent Generation
目前现有的LLM-based multi-agent方法都是依靠预定义的agent来实现简单的任务,这限制了其在复杂场景中的应用。本文提出了AutoAgents,它能够自适应地生成和协调多个分化(specialized)的agent,从而根据不同任务构造智能体团队。
链接:https://www.aminer.cn/pub/651a282d3fda6d7f0600a299/?f=cs
3. Dynamic LLM-Agent Network: An LLM-agent Collaboration Framework with Agent Team Optimization
目前多智能体的方法大多让智能体在静态框架交互来实现协作,这很依赖先验知识且缺少泛化性,本文提出构造一个策略性的智能体团队方法DyLAN,使多个智能体在基于任务的动态框架中进行交互。
链接:https://www.aminer.cn/pub/651ccb383fda6d7f06635548/?f=cs
4. MetaGPT: Meta Programming for Multi-Agent Collaborative Framework
本文提出了MetaGPT,一种新颖的元编程框架,将高效的人工工作流融入到基于LLM的多智能体协作中。
链接:https://www.aminer.cn/pub/64c9d5313fda6d7f0637e627/?f=cs
5. Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game
本文构建了基于强化学习的LLM-based agent,用于狼人游戏(Werewolf game)中的策略扮演。
6. Building Cooperative Embodied Agents Modularly with Large Language Models
本文解决了多智能体合作问题,包括去中心化控制、原始感官观测、通信代价问题,以及在多种不同环境下的多目标任务。
链接:https://www.aminer.cn/pub/64a63bddd68f896efaec67de/?f=cs
7. ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate
本文构建了一个多智能体裁判小组ChatEval,它可以自主地讨论和评测不同文本的质量。
链接:https://www.aminer.cn/pub/64dafb293fda6d7f064e2e02/?f=cs
8. MindAgent: Emergent Gaming Interaction
本文提出了一种评测规划能力和应急协作能力的框架,该评测在游戏交互背景下实现。
链接:https://www.aminer.cn/pub/650904f23fda6d7f06cd5432/?f=cs
9. DebateGPT: Fine-tuning Large Language Models with Multi-agent Debate Supervision
本文提出了DebateGPT,它通过多智能体之间的辩论提取相关指令来微调模型。
10. Welfare Diplomacy: Benchmarking Language Model Cooperation
本文提出了零和博弈Diplomacy的一个总额变体,即Welfare Diplomacy,在该游戏中,玩家必须在军事征服和国内福利投资之间取得平衡。
链接:https://www.aminer.cn/pub/652c9d07939a5f40825c0cbf/?f=cs
11. Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration
本文提出了Corex,提出通过辩论、复盘、检索策略使多智能体协作,共同解决复杂任务。
链接:https://www.aminer.cn/pub/651b79a33fda6d7f0628d45c/?f=cs
AMiner AI使用入口:https://www.aminer.cn/chat/g/explain
更多推荐
所有评论(0)