论文浅尝 | GNN-RAG:基于图神经检索的知识图谱大语言模型高效推理(ACL2025)
在稠密子图上进行推理,即根据问题计算每个节点的相关性权重,并聚合邻居节点信息,逐层传播,最终输出候选答案节点及其与问题实体的最短路径。OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。实验表明,该方法在多跳、多实体问题中效果尤其突出,并在效率上优于长上下文检索。进行推理,既保证了复杂问题下的准确性,又大幅度降低了。调用来

笔记整理:Chaney,浙江大学博士
论文链接:https://aclanthology.org/2025.findings-acl.856.pdf
发表会议:ACL 2025
1. 动机
检索增强生成(RAG)在知识图谱问答(KGQA)中通过整合从知识图谱(KG)检索到的信息,提高了大语言模型(LLMs)的上下文能力。然而,目前大多数方法依赖LLM API调用来生成可执行的关系路径或遍历知识图谱,这在复杂的KGQA任务(例如涉及多跳或多实体的问题)中不仅效率低下且计算昂贵。如何在尽可能降低计算成本的前提下,高效准确地从知识图谱中进行信息检索成为一个重要问题。为此,作者引入了GNN-RAG框架,该框架利用轻量级图神经网络(GNNs)进行有效且高效的图检索。GNN学习根据节点与问题的相关性以及其邻近节点的相关性为节点分配重要性权重。这使得该框架能够有效处理图中远距离节点的上下文,从而提高检索性能。
2. 贡献
本文的主要贡献有:
(1)提出利用图神经网络进行知识图谱检索,结合LLM进行最终推理;
(2)在WebQSP、CWQ等基准数据集上取得SOTA效果,并显著降低计算和API调用成本;
(3)提出两种框架扩展方式,结合基于LLM的语义解析器与动态选择检索策略,可进一步提升召回率与泛化性;
3. 方法
GNN-RAG的总体框架如图1所示。在第一阶段输入问题与KG子图,轻量级GNN在稠密子图上进行推理,即根据问题计算每个节点的相关性权重,并聚合邻居节点信息,逐层传播,最终输出候选答案节点及其与问题实体的最短路径。在第二阶段,将GNN提取出的推理路径转化为自然语言格式,并与问题一起作为上下文提供给LLM,辅助LLM进行最终答案生成。此外,GNN-RAG 可以与 RoG (一种语义解析模型,可根据问题生成可执行的关系路径)结合,从而生成更全面的关系路径集合;同时,还可通过引入路由机制,在长上下文检索与GNN-RAG 之间动态选择,以平衡准确率和效率。

图1 GNN-RAG总体框架图
4. 实验
作者在WebQSP、ComplexWebQuestions(CWQ)和MetaQA-3三个基准数据集上展开实验,对比的基线方法包括GNN基线(如ReaRev)、LLM基线(如ToG、RoG)以及长上下文检索基线(如SubgraphRAG),评测指标为Hit、F1 Score、Hit@k以及H@1。
实验如图2,图3所示。GNN-RAG 在 WebQSP、CWQ 上的 F1 分数超越现有方法,在复杂问题上提升 8.9–15.5%。在多跳、多实体问题上,GNN-RAG 显著优于 RoG 与 SubgraphRAG。相比 SubgraphRAG,GNN-RAG 使用 9 倍更少的 tokens,推理延迟更低(30 分钟 vs 42–58 分钟)。
表1 主实验结果

表2 多跳和多实体问题表现

5. 总结
本文提出的 GNN-RAG 框架,在知识图谱问答中通过 GNN 进行高效检索,再结合 LLM 进行推理,既保证了复杂问题下的准确性,又大幅度降低了 LLM 调用成本。实验表明,该方法在多跳、多实体问题中效果尤其突出,并在效率上优于长上下文检索。未来工作可探索更紧密的 GNN-LLM 交互和提示优化。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。



点击阅读原文,进入 OpenKG 网站。
更多推荐

所有评论(0)