输入“/”快速插入内容

2023-05-09大语言模型实现智能客服知识库文档数据提取功能-今日头条

2023年8月8日修改
大语言模型实现智能客服知识库文档数据提取功能
2023-05-09 14:16 · 人人都是产品经理
智能客服的知识库有两类:机器人知识库和坐席知识库,分别是为机器人和坐席进行服务时,提供数据的支撑。如何通过大语言模型,让企业的文档可批量上传,无需更多的整理,直接转化为有效的QA,供座席和机器人直接调用呢?本文作者对此进行了分析,一起来看一下吧。
上一篇提到了《大语言模型实现智能客服知识库自动扩写功能》,这次谈下知识库文档数据提取功能的实现。
一、产品场景和需求
我们知道智能客服的知识库有两类:机器人知识库和座席知识库。
分别是为机器人和座席进行服务时,提供数据的支撑。
智能客服系统会标配知识库管理功能,常见的形式是树状结构,提供分类管理、知识库条目管理,并支持知识库的批量导入导出操作。
使用中,企业需要经常性地维护管理知识库内容,将企业已有知识内容文档上传,但如果是将原文件上传,则系统最多能支持预览功能,使用者在操作界面只能点击打开全文检索。而如果是机器人知识库,直接上传文档是不可用的,需要操作者手工整理文档中的内容为机器人标准问答对。
以上是目前绝大多数主流产品的使用情况。
大语言模型来了,我们提出的需求很简单,所有企业的文档可以批量上传,无需更多的整理,直接可自动转化为有效的QA,供座席和机器人直接调用。
二、知识提取实测:PDF文档内容提取
已有诸多产品使用大语言模型实现PDF文档数据提取,我们先看下已实现的产品的效果。
1. ChatPDF
界面特别干净,上传pdf,然后conversation。
为了测试,我扔了一份100页的产品手册进来。
上传速度很快,最关键的时,对话响应也非常的快。
对文档内容的解析很准确,包括一些隐藏在内部的知识点也可以快速搜索找到。
2. Pandagpt
网络问题,访问有点慢,但是这个对话的样式,一言难尽,没有一个版块不是互相遮挡的,强迫症死敌。
响应速度差一些,问题回答基本到位,相比ChatPDF,略显啰嗦。