大型语言模型的检索增强生成：综述

2024年7月2日修改

论文地址：

主题与背景

本文是一篇关于大型语言模型（LLMs）中检索增强生成（RAG）的综述。主要作者来自上海智能自主系统研究所在复旦大学计算机科学学院数据科学实验室和同济大学设计与创新学院的研究团队。

文章探讨了RAG的开发范式、组件和评估方法，并展望了未来的研究方向。

主要观点

RAG的定义与优势

RAG通过在回答问题或生成文本前从外部知识库检索相关信息，显著提高了答案的准确性，减少了模型的幻觉，尤其是在知识密集型任务中。

RAG通过引用来源，使用户可以验证答案的准确性，增加对模型输出的信任。

RAG结合了参数化的知识和非参数化的外部知识库，有效地解决了纯参数化模型的局限性。

RAG的框架与进化

文章总结了RAG的三个主要发展范式：朴素RAG、高级RAG和模块化RAG。

详细介绍了RAG的三个核心组件：检索器、生成器和增强方法，以及每个组件中的关键技术。

讨论了如何评估RAG模型的有效性，介绍了两种评估方法，强调了关键评估指标和能力。

RAG的评估与应用

分析了RAG的评估系统、适用场景和其他相关内容。

展望了RAG的未来发展趋势，并总结了本文的主要内容。

总结

大型语言模型的检索增强生成：综述​