[发明专利]一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统在审
申请号: | 202110254690.3 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112948557A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 齐乐;张宇;汤嘉琦;刘挺 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/30;G06Q10/10;G06Q30/00 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 张宏威 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 说明 文档 辅助 可迭代 基于 常用 问题 智能 客服 系统 | ||
1.一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统,其特征在于:所述系统具体包括基于常问问题集FAQ的自动客服模块和以文档说明为辅助的人工客服模块两部分组成;
当用户输入问题时,系统先将用户提问输入到基于常问问题集FAQ的自动客服模块,该模块利用问题相似度计算技术,从FAQ中选择与用户问题最相似的问题,并将答案返回给客户;
若基于常问问题集FAQ的自动客服模块无法回答用户的问题,即基于常问问题集合中没有和用户问题相关的答案,系统则将用户问题推送到以文档说明为辅助的人工客服模块,在所述人工客服模块中,系统通过基于文档的答案抽取技术,从产品说明文档中抽取出可能包含答案的文档片段,将所述文档片段与用户问题发送给人工客服,经人工客服编辑后,将答案返回给客户,同时将所述答案和原问题加入常问问题集FAQ中,使系统再次面对类似问题的时候,可以直接回答用户问题。
2.根据权利要求1所述系统,其特征在于,基于常问问题集FAQ的自动客服模块由一系列人工标注的问答对组成,对于问题集合中的一条记录r,用(Q,A)进行表示,其中Q表示问题,A表示对应该问题的标准答案;
基于常问问题集FAQ的自动客服模块利用问题相似度计算技术从FAQ中找到最相似的问题,并返回相应的标准答案;
以BERT模型为基础的问题相似度计算模型,所述BERT模型由12层Transformer叠加而成,经由预训练建模句子的语义信息,并判断句子之间是否相似。
3.根据权利要求2所述系统,其特征在于,以BERT模型为基础的问题相似度计算模型分为两个部分,第一部分以BERT预训练训练模型为基础的表示层,第二部分为匹配层;所述表示层以两个句子作为输入,得到两个句子的向量表示,句子之间由特殊的符号进行分割;所述匹配层使用两个句子语义向量来计算他们之间的匹配分数,将匹配分数最高的句子作为用户问题的答案。
4.根据权利要求3所述系统,其特征在于,以文档说明为辅助的人工客服模块使用基于文档的答案抽取技术从说明文档集合中抽取出和用户提问相关的片段作为候选答案,从多篇相关文档中得到用户问题的候选答案集合,人工客服从所述候选答案集合中筛选编辑后,给出用户问题的答案。
5.根据权利要求4所述系统,其特征在于,所述基于文档的答案抽取技术的过程分为相关文档检索和答案抽取;
相关文档检索:对于用户的问题,在已有的文档库中查询可能存在答案的相关文档,然后将相关文档返回;
答案抽取:设计一个基于多文档的抽取式阅读理解模型,所述模型分为词嵌入层、文档编码层、文档和问题交互层和指针输出层;所述词嵌入层用于将文本中的每一个词与转换成机器能够处理的向量级表示,所述文档编码层在词嵌入层的基础上进一步挖掘句子级别的上下文信息,所述文档和问题交互层采用注意力机制将问题和篇章进行对齐,找出文档中与问题最相关的部分,所述指针输出层根据篇章中每一个单词的概率值预测答案的起始位置和结束位置。
6.根据权利要求5所述系统,其特征在于,以文档说明为辅助的人工客服模块将编辑后的答案和原问题一起存入基于常问问题集FAQ的自动客服模块的问答库中,当系统再次遇到类似问题时,能直接回答该问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110254690.3/1.html,转载请声明来源钻瓜专利网。