- 大模型+知识库/数据库问答实践过程的经验汇总
- 1 query 意图识别+意图补充+意图修复 环节
- 1.1 意图识别方式一:多关键词/主题词提取与检索
- 1.2 意图识别方式二:中心化大模型做语义识别
- 1.3 意图补充、修复、改写
- 1.4 多轮对话意图继承能力
- 1.5 过长提问的总结
- 1.6 拒绝回复
- 2 Text-to-SQL 环节
- 2.1 通过优质大模型解决 Text-to-SQL 的精准度问题
- 2.2 对Text-to-SQL 任务拆解
- 2.3 SQL 修复
- 3 知识库的向量搜索
- 4 结果核验与总结
- 4.1 结果总结
- 4.2 毒性检验
- 4.3 输出结构对齐
- 4.4 Text2SQL 数字幻觉
- 5 产品/数据的持续运营
- 6 云厂商的集成方案
- 6.1 基于Azure OpenAI模型服务的知识库问答系统
- 6.2 阿里云的 Tair向量检索
- 6.3 AquilaSQL-7B 文本-代码”生成模型
- 6.4 我在调研了十几个知识库对话产品后整理出来的功能清单
大模型+知识库/数据库问答实践过程的经验汇总
大模型+知识库/数据库问答实践过程的经验汇总
2024年8月19日修改
作者:悟乙己
本篇是沿着 【 悟乙己:想自己利用OpenAI做一个文档问答的话...... 】 知识库往后,目前很多大模型会用在知识库问答上,同时借助Text-to-SQL 也可以检索数据库进行回复( 悟乙己:大模型与数据科学:从Text-to-SQL 开始(一) )。知识库检索与数据库检索,会是之后大模型应用的标配,所以相应的实践过程中会遇到不一样的问题。
笔者随便画一个草图,在这个过程中,有几个环节可以应用到大模型:
•
query意图识别+意图补充+意图修复
•
Text-to-SQL
•
文本总结
附件不支持打印
加载失败,
那么这三个环节前面两个应该问题多