[发明专利]答案匹配方法、装置、电子设备及存储介质有效
申请号: | 201911072978.8 | 申请日: | 2019-11-05 |
公开(公告)号: | CN110837548B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 杜维;李渊;刘设伟 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/00;G06Q30/00 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;石海霞 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 答案 匹配 方法 装置 电子设备 存储 介质 | ||
1.一种答案匹配方法,其特征在于,包括:
从包括多个问答轮次的对话记录中获取当前状态数据,所述当前状态数据包括当前问答轮次的用户问题、前一问答轮次的用户问题以及前一问答轮次的回复答案;
将所述当前状态数据输入预先训练的增强学习模型,得到由所述增强学习模型输出的对应于所述当前状态数据的候选答案集合;
获取用户意图信息,并利用所述用户意图信息对所述候选答案集合进行筛选后得到目标答案集合;
根据所述目标答案集合中各个候选答案的分布概率,确定一个目标答案作为当前问答轮次的回复答案。
2.根据权利要求1所述的答案匹配方法,其特征在于,所述增强学习模型的训练过程包括:
从包括多个问答轮次的历史聊天语料库中获取第一训练样本集,并利用所述第一训练样本集训练序列到序列模型;
根据训练得到的序列到序列模型确定回报分值和候选答案集,并通过预先获取的用户意图信息对所述候选答案集进行筛选;
通过所述回报分值以及筛选后的所述候选答案集在第一训练样本集中训练得到初始化增强学习模型;
根据所述初始化增强学习模型得到第二训练样本集,并利用所述第二训练样本集训练增强学习模型。
3.根据权利要求2所述的答案匹配方法,其特征在于,所述从包括多个问答轮次的历史聊天语料库中获取第一训练样本集,并利用所述第一训练样本集训练序列到序列模型包括:
从包括多个问答轮次的历史聊天语料库中获取各个问答轮次的用户问题和回复答案作为第一训练样本集;
以第一训练样本集中的当前问答轮次的用户问题、前一问答轮次的用户问题以及前一问答轮次的回复答案为输入参数,以当前问答轮次的回复答案为输出目标,根据极大似然估计的迭代原理训练第一序列到序列模型;
以第一训练样本集中的当前问答轮次的回复答案为输入参数,以下一问答轮次的用户问题以及下一问答轮次的回复答案为输出目标,根据极大似然估计的迭代原理训练第二序列到序列模型。
4.根据权利要求2所述的答案匹配方法,其特征在于,所述根据训练得到的序列到序列模型确定回报分值和候选答案集包括:
根据训练得到的第一序列到序列模型和第二序列到序列模型得到语义一致性奖励分值;
根据训练得到的第二序列到序列模型得到不良答案惩罚分值;
根据语义一致性奖励分值和不良答案惩罚分值得到回报分值;
根据训练得到的第一序列到序列模型得到候选答案集。
5.根据权利要求4所述的答案匹配方法,其特征在于,所述通过所述回报分值以及筛选后的所述候选答案集在第一训练样本集中训练得到初始化增强学习模型包括:
使用随机梯度下降法,通过所述候选答案集和所述语义一致性奖励分值在第一训练样本集中对第一序列到序列模型进行训练,得到所述初始化增强学习模型。
6.根据权利要求2所述的答案匹配方法,其特征在于,所述根据所述初始化增强学习模型得到第二训练样本集包括:
根据所述初始化增强学习模型和各个问答轮次的当前状态数据得到各个问答轮次的回复答案和回报分值,所述各个问答轮次的回复答案为一个问答批次中按照对话顺序生成的各个问答轮次的回复答案,所述各个问答轮次的当前状态数据为对应于一个问答批次中各个问答轮次的回复答案的当前状态数据,所述各个问答轮次的回报分值为对应于一个问答批次中各个问答轮次的回复答案的回报分值;
将一个问答批次中各个问答轮次的当前状态数据、各个问答轮次的回复答案和各个问答轮次的回报分值组成训练样本,以确定包括所述训练样本的第二训练样本集。
7.根据权利要求6所述的答案匹配方法,其特征在于,所述利用所述第二训练样本集训练增强学习模型包括:
利用所述第二训练样本集中一个完整的问答批次中各个问答轮次的训练样本以策略迭代的方法训练增强学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911072978.8/1.html,转载请声明来源钻瓜专利网。