输入“/”快速插入内容

Task3:实现 RAG 应用

2024年7月4日创建
3920
5637
8
1
💡
教程贡献者说:
在今天的学习中,你将和我一起入门简单的前端部署及RAG系统的开发,我们可以很容易在魔搭社区平台上部署一个简单的向量数据库及对应的检索增强系统。什么?你不知道什么是 RAG,没关系!让我们今天把它轻松拿下。
写在开头
欢迎大家来到从零入门CPU部署大模型夏令营学习的 task3 环节,在本环节,我们将一起学习如何从零部署一个 RAG 系统。
在当下,运行大语言模型已经是再平凡不过的事情。但随着大家对 LLM 使用的加深,我们发现,在使用过程中,大模型会有很多幻觉出现。为了解决幻觉,科研人员提出了各种各样的方案,努力提高长上下文下的召回精度,但就成本与效果而言,在目前都不如简单粗暴的检索增强生成(RAG)。
通过 RAG 系统的构建,我们能够以最小的成本获得最准确的信息,降低成本;它也是大模型应用开发中最简单的一种应用,结合了大语言模型效果微调、向量数据库部署、流程设计等多方面的要素,能够帮助你快速了解可落地应用的最简开发流程。
那么,RAG 系统究竟是怎么构建的呢?我们又该如何构建好的 RAG 系统?带着这些问题,希望你能够在 task3 中找到属于你的答案!
Gradio技术入门
在开始之前, 我们先来复习在赛事流程中,我们所应用到的python前端开发框架。
Gradio 是一个开源的 Python 库,用于快速构建机器学习和数据科学演示应用。它使得开发者可以在几行代码中创建一个简单、可调整的用户界面,用于展示机器学习模型或数据科学工作流程。Gradio 支持多种输入输出组件,如文本、图片、视频、音频等,并且可以轻松地分享应用,包括在互联网上分享和在局域网内分享.
简单来说,利用 Gradio 库,我们可以很容易实现一个具有对话功能的前端页面,实现最简单人机交互功能。