[发明专利]问答处理方法、装置、存储介质和电子设备在审
申请号: | 202011114806.5 | 申请日: | 2020-10-16 |
公开(公告)号: | CN112417105A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 杨正良;刘设伟;陈利琴 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 处理 方法 装置 存储 介质 电子设备 | ||
本发明公开了一种问答处理方法,包括:获取用户问题,基于文本筛选模型,从用户问题对应的目标文本中筛选与用户问题相关的候选段落,基于答案生成模型,生成至少一个候选段落中与用户问题匹配的多个候选答案,基于答案排序模型,对多个候选答案进行排序得到排序结果,根据至少一个候选段落、多个候选答案和排序结果,从多个候选答案中选取用户问题对应的目标答案,使得文本筛选、答案生成、答案排序三个部分的输入端到输出端直接用一个神经网络相连,并统一进行联合训练,避免了各个部分训练目标不一致导致训练出的系统难以达到最优的性能,通过文本筛选、答案生成、答案排序三个步骤使得最终得到的答案更加精准和合理,提高了问答处理的效率。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种问答处理方法、一种问答处理装置、一种存储介质及一种电子设备。
背景技术
机器阅读理解是目前一种新的QA(Question Answering,问题回答)方式,其任务为:给定样本数据,数据包括文本材料,问题以及对应问题的答案,并且给出答案在文本材料中的对应位置信息;目标是希望能够针对给定的训练集数据构建阅读理解模型,使得该模型具有回答测试集数据中给定文本材料问题的能力,回答问题的回答质量由给定的评价指标来判断。目标是回答问题的回答质量在给定评价指标上值越大越好,最终模型根据评价指标值的得分高低来评价优劣。
如图1所示基于知识库的问答处理流程的示意图,传统的客服机器人采用检索、匹配、排序这种流程,首先构建FAQ知识库系统,然后通过相关检索算法从知识库中检索出与用户问题相关的FAQ问答对,最后通过语义匹配算法寻找候选答案,并进行召回排序寻找出最佳答案。这种方式需要大量的人力去构建知识库,而且这种大多是基于单文档的,导致答案可能不完整,难以确保答案是最佳答案。
发明内容
鉴于上述问题,提出了一种问答处理方法、装置、存储介质及电子设备,以解决大量的人力去构建知识库,而且这种大多是基于单文档的,导致答案可能不完整,难以确保答案是最佳答案的问题。
依据本发明的一个方面,提供了一种问答处理方法,包括:
获取用户问题;
基于文本筛选模型,从用户问题对应的目标文本中,筛选与所述用户问题相关的至少一个候选段落;
基于答案生成模型,生成所述至少一个候选段落中与所述用户问题匹配的多个候选答案;
基于答案排序模型,对所述多个候选答案进行排序,得到所述多个候选答案的排序结果;
根据所述至少一个候选段落、多个候选答案和排序结果,从所述多个候选答案中选取所述用户问题对应的目标答案;
其中,所述文本筛选模型、答案生成模型和答案排序模型是联合训练的。
可选地,在所述获取用户问题之前,所述方法还包括:
利用待训练的文本筛选模型,从训练问题对应的训练文本中,筛选与所述训练问题相关的至少一个候选段落;
利用待训练的答案生成模型,生成所述至少一个候选段落中与所述训练问题匹配的多个候选答案;
利用待训练的答案排序模型,对所述多个候选答案进行排序,得到所述多个候选答案的排序结果;
基于所述多个候选答案和排序结果来对所述待训练的文本筛选模型、待训练的答案生成模型和待训练的答案排序模型进行联合训练。
可选地,在所述利用待训练的文本筛选模型,从训练问题对应的训练文本中,筛选与所述训练问题相关的至少一个候选段落之前,所述方法还包括:
从多个预处理文档中,查找所述训练问题对应的训练文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011114806.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电脑散热器的加工工艺
- 下一篇:进校离校的打卡方法、装置及计算机存储介质