[发明专利]问答处理方法、装置、存储介质和电子设备在审
申请号: | 202011114806.5 | 申请日: | 2020-10-16 |
公开(公告)号: | CN112417105A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 杨正良;刘设伟;陈利琴 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 处理 方法 装置 存储 介质 电子设备 | ||
1.一种问答处理方法,其特征在于,包括:
获取用户问题;
基于文本筛选模型,从用户问题对应的目标文本中,筛选与所述用户问题相关的至少一个候选段落;
基于答案生成模型,生成所述至少一个候选段落中与所述用户问题匹配的多个候选答案;
基于答案排序模型,对所述多个候选答案进行排序,得到所述多个候选答案的排序结果;
根据所述至少一个候选段落、多个候选答案和排序结果,从所述多个候选答案中选取所述用户问题对应的目标答案;
其中,所述文本筛选模型、答案生成模型和答案排序模型是联合训练的。
2.根据权利要求1所述的方法,其特征在于,在所述获取用户问题之前,所述方法还包括:
利用待训练的文本筛选模型,从训练问题对应的训练文本中,筛选与所述训练问题相关的至少一个候选段落;
利用待训练的答案生成模型,生成所述至少一个候选段落中与所述训练问题匹配的多个候选答案;
利用待训练的答案排序模型,对所述多个候选答案进行排序,得到所述多个候选答案的排序结果;
基于所述多个候选答案和排序结果来对所述待训练的文本筛选模型、待训练的答案生成模型和待训练的答案排序模型进行联合训练。
3.根据权利要求2所述的方法,其特征在于,在所述利用待训练的文本筛选模型,从训练问题对应的训练文本中,筛选与所述训练问题相关的至少一个候选段落之前,所述方法还包括:
从多个预处理文档中,查找所述训练问题对应的训练文本。
4.根据权利要求2所述的方法,其特征在于,在所述利用待训练的文本筛选模型,从训练问题对应的训练文本中,筛选与所述训练问题相关的至少一个候选段落之前,所述方法还包括:
将所述训练文本按照滑动窗口的方式进行分割,得到多个子文本;
从所述多个子文本中,查找与所述训练文本相关的预设个数的子文本;
对所述训练问题和所述预设个数的子文本进行编码,得到对应的上下文向量。
5.根据权利要求4所述的方法,其特征在于,所述利用待训练的文本筛选模型,从训练问题对应的训练文本中,筛选与所述训练问题相关的至少一个候选段落包括:
利用所述待训练的文本筛选模型,根据所述上下文向量,计算所述训练文本中多个段落与所述训练问题之间的相关性数据;
根据所述相关性数据,筛选与所述训练问题相关的至少一个候选段落。
6.根据权利要求4所述的方法,其特征在于,所述利用待训练的答案生成模型,生成所述至少一个候选段落中与所述训练问题匹配的多个候选答案包括:
利用所述待训练的答案生成模型,根据所述上下文向量,对所述至少一个候选段落中多个答案与所述训练问题进行匹配,得到所述多个答案的开始索引对应的开始匹配度和结束索引对应的结束匹配度;
根据所述开始匹配度和结束匹配度,生成与所述训练问题匹配的多个候选答案。
7.根据权利要求4所述的方法,其特征在于,所述利用待训练的答案排序模型,对所述多个候选答案进行排序,得到所述多个候选答案的排序结果包括:
剔除所述多个候选答案中与其他候选答案存在重叠的候选答案,得到目标候选答案;
利用所述待训练的答案排序模型,根据所述上下文向量,计算所述目标候选答案与所述训练问题之间的问答匹配度,以及所述目标候选答案与标记答案之间的答案匹配度;
根据所述问答匹配度和答案匹配度,对所述多个候选答案进行排序,得到所述多个候选答案的排序结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011114806.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电脑散热器的加工工艺
- 下一篇:进校离校的打卡方法、装置及计算机存储介质