输入“/”快速插入内容

Neo4j CTO:RAG的下半场GraphRAG!

2024年8月27日修改
作者:PaperAgent
我们正在进入 RAG 的“蓝色链接”时代
我们即将意识到,要想用GenAI做任何有意义的事情,你不能 依赖自回归LLM来做决定。我知道你在想什么:“RAG就是答案。”或者微调,或者 GPT-5。
是的。基于向量的 RAG 和微调等技术可以提供帮助。它们对于某些用例来说已经足够好了。但还有 另一类 用例,这些技术都遇到了瓶颈。基于向量的 RAG(与微调一样)增加了许多问题正确答案的概率。然而,这两种技术都不能确保答案正确。 不会给你留下很多关于它们 为什么 做出特定决定的线索。
早在 2012 年, 谷歌 就推出了他们的第二代搜索引擎,并在一篇标志性的博客文章中发表了一篇名为“ 介绍知识图谱:事物,而不是字符串 ”的文章。他们发现,如果使用知识图谱来组织所有这些网页中字符串所代表的 事物 ,并 进行 所有的字符串处理,那么能力就有可能实现巨大的飞跃。我们今天在 GenAI 中看到了同样的模式。许多 GenAI 项目都遇到了瓶颈,结果的质量受到所使用的解决方案处理的是字符串 而不是事物这一事实的 限制。
如今,处于前沿的人工智能工程师和学术研究人员发现了与谷歌相同的事情: 突破这一天花板的秘诀是知识图谱 。换句话说,将有关 事物 的知识融入基于统计的文本技术中。这就像任何其他类型的 RAG 一样,除了向量索引之外还调用了知识图谱。或者换句话说, GraphRAG
Graph是什么?
让我们明确一点,当我们说 图谱(Graph) 时,我们的意思是这样的:
虽然这张图片已被广泛用于举例说明知识图谱,但原始来源和作者仍未确定
或这个:
威廉·里昂 (William Lyon) 创作的《权力的游戏》图表可视化