AgentReview: 利用大模型智能体探究学术出版同行评审机制

同行评审是科学出版完整性和发展的基础。传统的同行评审分析方法往往依赖对现有同行评审数据的探索和统计，这不足以充分解决过程的多变量特性，无法考虑潜在变量，并且由于数据的敏感性而受到隐私问题的进一步限制。本文介绍了AgentReview，这是第一个基于大型语言模型（LLM）的同行评审模拟框架，能够有效拆解多个潜在因素的影响，并解决隐私问题。我们的研究揭示了重要的洞察，包括由于评审者偏见导致的论文决定变

江湖人称麻花滕

939人浏览 · 2024-11-05 20:25:28

江湖人称麻花滕 · 2024-11-05 20:25:28 发布

标题：AgentReview: Exploring Peer Review Dynamics with LLM Agents
github网站：https://AgentReview.github.io

摘要总结

论文精读

研究背景

研究问题：这篇文章要解决的问题是如何在保护审稿人隐私的前提下，通过大规模语言模型（LLM）代理模拟同行评审过程，揭示影响同行评审结果的多重潜在因素。
研究难点：该问题的研究难点包括：同行评审过程的多变量性质、难以测量的潜在变量以及数据隐私问题。
相关工作：该问题的研究相关工作包括对现有同行评审数据的分析和统计，但这些方法未能充分考虑过程的多元性、潜在变量和数据隐私问题。

研究方法

这篇论文提出了AGENTREVIEW，第一个基于LLM的同行评审模拟框架。具体来说，

框架概述：AGENTREVIEW通过集成LLM代理和基于代理的建模来模拟同行评审过程。该框架包括审稿人、作者和领域主席（AC）三个角色，所有角色均由LLM代理驱动。

评审过程设计：使用一个结构化的五阶段管道来模拟同行评审过程：
评审人评估：每个评审人独立评估稿件，生成包含四个部分（重要性与创新性、接受理由、拒绝理由和改进建议）的评论。
作者-评审人讨论：作者在评审人-AC讨论期间回应初始评论。
评审人-AC讨论：AC发起讨论，要求评审人重新考虑初始评分并更新评论。
元评审编写：AC综合讨论、反馈和自己的观察，编写元评审。
论文决定：AC审查所有元评审，做出接受或拒绝的决定。
数据选择：使用ICLR会议的真实提交数据，确保模拟评论与现实场景紧密相关。数据选择标准包括会议的国际影响力、论文的公开可用性、质量分布和时间跨度。
基线设置：建立一个没有特定LLM代理特征的基线设置，以便测量单个变量变化的影响。

实验设计

数据收集：从ICLR会议的真实提交中检索2020年至2023年的论文数据，涵盖口头报告、亮点、海报和拒绝四类论文。
样本选择：采用分层抽样技术从每类论文中选择样本，最终得到350篇拒绝论文、125篇海报、29篇亮点和19篇口头报告论文。
参数配置：在实验中，逐步替换正常评审人为负责任或不负责任的评审人，并分析其对评审结果的影响。

结果与分析

评审人的作用：
社会影响力：评审人在反驳后通常会调整评分以与同伴保持一致，导致评分的标准差显著下降。
利他主义疲劳和同伴效应：一个不负责的评审人可以导致所有评审人的承诺显著下降。
群体思维和回音室效应：有偏见的评审人通过互动放大彼此的负面意见，导致评分下降。
权威偏见和晕轮效应：评审人倾向于认为知名作者的稿件更准确，当所有评审人知道作者身份的比例为10%时，决策变化显著。
锚定偏见：反驳阶段对最终结果的影响较小，可能是由于评审人过于依赖初步印象。
领域主席的作用：
包容性AC：最能与基线保持一致，有效整合多样化观点。
权威AC：决策与基线相关性较低，可能受个人偏见影响。
顺从AC：尽管与评审人评价高度语义重叠，但可能缺乏独立判断。
作者匿名性的影响：
权威偏见：评审人更倾向于给知名作者的稿件好评。
同行评审机制的影响：
反驳的影响：取消反驳阶段对最终决定影响较小，可能是由于锚定偏见。
整体评分的影响：取消整体评分显著改变了决策格局，可能导致不同的决定。

角色和提示词示例

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述