
今天为大家分享的是关于RAG架构选型的论文。GraphRAG和Agentic RAG越来越火每个都在喊自己更强。但当你真要在生产环境选一个的时候没人告诉你什么样的数据用什么样的RAG复杂架构到底什么时候才值得上这篇论文搭了一个9种RAG场景的统一评测框架从最简单的纯文本RAG到agent-graph整合全覆盖还顺手点破了一个反直觉事实——检索质量上去了生成质量不一定跟着涨。高级RAG到处上但没人系统对比过9种RAG场景对比GraphRAG、Modular RAG、Agentic RAG各自声称更强但缺少统一场景的横向对比。场景选择依赖数据特征有没有关系数据和查询复杂度生产环境决策无依据。更麻烦的是现有评测多用retrieval-oriented metricsHitk、Recallk没考察end-to-end generation quality——这导致检索好被等同于生成好但论文证明这两件事不是一回事。9种RAG场景从纯文本到agent-graph整合论文把RAG生态拆成9个标准化场景覆盖了当前主流的所有架构变体Regular RAG场景1-2最基础的纯文本路线。场景1只用entity description文档做vector retrieval场景2在文档里augment 1-hop邻居按relation type分组GraphRAG场景3-5引入知识图谱的路线。场景3只用predefined KGLLM extract entity → k-hop subgraph → triplet serialize → 生成场景4是hybrid textgraph并行检索场景5用computed KG从文档抽取关系构造Modular Agentic RAG场景6-9引入agent的路线。场景6是modular RAGQuery Reformatter Document Reranker场景7是agentic RAGmulti-step ReAct 工具调用场景8是agentgraph整合场景9是batch agentic retrievalReAct ReWOO混合这9种场景不是随手列的每一个对应一种真实数据特征和查询复杂度组合——你拿着自己的业务对号入座就行。Context优化方案token降19-53%的三个机制GraphRAG和Agentic RAG最头疼的是context/memory overflow——agent每一步都要resend full conversation historytoken成本指数级爆。论文给了三个机制一起压context优化效果机制一relation-grouped graph representation。传统triplet格式(entity1, rel1, entity2), (entity1, rel2, entity2), (entity1, rel3, entity2)在连接同一个entity的关系多时token线性增长。新格式把它压成(entity1 - (rel1||rel2||rel3) - entity2)——连接n条关系的entity token从O(n)降到O(1)。机制二graph retrieval deduplication。Agent session内维护一个unified subgraph新检索不是append而是mergeentity-level和relation-level双重去重相同entity/relation的new findings并入既有subgraph。结果是context增长sublinear而不是linear——agent多跑几步不会爆context。机制三content-aware document dedup。文档侧用content hash识别并消除重复文档/chunk——这个在document-heavy场景特别关键许多agent会反复retrieve同一个chunk。外加batch agentic retrieval。ReAct ReWOO混合——agent一次formulate多个互补sub-query单次batched retrieval call执行而不是每个sub-query独立走一个round-trip。每省一个round-trip就省一次resend full conversation history的开销。省下的token预算论文建议再投资到扩展retrieval更多paths、更多subgraphs、更多nonredundant chunks但下面的发现会告诉你这件事没那么简单。实验展示实验设置细节Amazon Neptune Bedrock LlamaIndex论文全部跑在AWS生产级基础设施上可复现预定义KG侧129K实体 8.1M关系入Amazon Neptune Analytics GraphopenCypher接口LlamaIndex加载为property graph indexCypherTemplateRetriever做KG retrieverh2 hop邻居max 100 paths避免指数爆炸。文档检索侧Amazon Bedrock Knowledge BasesAmazon Titan Text Embedding v2做embeddingOpenSearch Serverless做vector store每次检索20文档。computed KG实验Bedrock预定义GraphRAG process——从文档自动抽取关系构造KG。Agentic RAG实现LLM Query Reformatter Document Reranker用于modular RAGmulti-step ReAct用于agentic RAG。全部生产级组件没有toy implementation——这意味着复现成本不低但结论可信度高。硬结果token降19-53% retrieval-generation gap9种RAG场景评测结果Token优化context优化在GraphRAG和Agentic RAG上token减少19-53%——这是硬结果不挑数据。反直觉发现retrieval-generation gap。扩展retrieval不proportionally提升generation quality。换句话说你把retrieval从Hit50.6提到Hit50.9generation accuracy不会跟着从0.6到0.9——可能只到0.7甚至不动。含义直接戳到圈内痛点retrieval-oriented metricsHitk, Recallk高估了高级检索的实际收益。你看到GraphRAG的Recall20比Regular RAG高一截觉得值了——但end-to-end generation quality可能几乎没差。这意味着大量基于retrieval metrics做的架构选型决策是偏的。小扬观点这篇论文给RAG架构选型圈一个清醒的判断复杂架构不是万能的retrieval metrics在骗你。具体启示先看数据特征再选架构——没有关系数据别上GraphRAG简单查询别上Agentic RAG9种场景对号入座retrieval-generation gap是结构性现象——扩展retrieval不会proportionally提升generation别被Hitk骗了评测必须end-to-end——用generation quality而不是retrieval metrics做架构决策context优化是必须的——三个机制token降19-53%不挑场景batch agentic retrieval值得抄——ReAct ReWOO混合减少round-trips省的token还能再投资RAG架构选型这件事第一次有了数据驱动的横向依据。GraphRAG不是不能上但要先想清楚你的数据是不是真有关系、查询是不是真复杂——否则你只是在为retrieval metrics的虚高买单。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】