[发明专利]一种基于回复增强的隐式个性化对话生成方法在审
申请号: | 202111337315.1 | 申请日: | 2021-11-12 |
公开(公告)号: | CN114021581A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 窦志成;刘嘉庆 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06K9/62;G06Q10/06 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 回复 增强 个性化 对话 生成 方法 | ||
1.一种基于回复增强的隐式个性化对话生成方法,其特征在于:方法利用给定的用户输入,生成个性化的对话回复,具体地,首先利用输入给定用户的历史回复数据作为查询,利用海量的开源训练数据作为文档,从训练数据中检索相关回复作为该用户的候选集;然后根据人设一致性判别器,判断候选集中的回复是否符合用户的个性化设定,计算候选集回复和用户真实回复的人设相似性得分,选择得分较高的回复作为该用户的个性化相似回复,所述人设一致性判别器包括基于BERT模型的回复层次人设一致性判别器,和基于HRED模型的上下文层次人设一致性判别器,其中所述回复层次人设一致性判别器仅考虑两个回复之间的人设一致性,所述上下文层次人设一致性判别器的还考虑了上下文的一致性;之后基于多任务学习的框架,通过两个编码器-解码器模型,来分别利用该用户的真实历史回复数据和增强的个性化相似数据进行训练,所述两个解码器共享参数,使得模型可以更充分地学到该用户的人设信息和个性化表达方式,得到符合用户个性化设定的回复生成结果;
在得到回复生成结果的基础上,提出度量个性化对话系统生成质量的方法,即在模型生成回复之后,将真实回复和生成回复,作为人设一致性判别器的输入,进而得到生成数据的人设一致性评分,用于在句子层面评价模型生成结果和用户个性化设定信息的一致性情况,最终输出评价结果和回复结果。
2.如权利要求1所述的一种基于回复增强的隐式个性化对话生成方法,其特征在于:所述回复层次的一致性判别器基于回复数据对,计算两条回复文本的人设相似性,采用预测两条回复是否来自于同一个用户的方式,给定两个回复response1和response2作为输入,计算这两个回复来自于同一用户的概率P(user1=user2)作为人设相似性的度量,其中,user1是response1的说话人,user2是response2的说话人,所述回复层次的人设一致性判别器基于BERT模型设计,两个回复以[SEP]分隔进行输入,然后使用[CLS]所对应的最终隐藏向量R作为最终的文本表示,并据此计算两条回复来自于同一用户的概率:
P(user1=user2)=softmax(Wp·R+bp)
对回复层次的人设一致性判别器而言,其训练数据的构建引入了对比学习的思想,即在训练阶段,随机选取来自于同一用户的回复对作为正例,然后随机选取来自于不同用户的回复对作为负例,使用标签1表示两条回复来自于同一用户,标签0表示两条回复来自于不同用户;在推断阶段,基于已训练好的模型,输入的两条回复中一条回复来自于用户的真实历史回复,另一条回复来自于候选集的回复数据,然后计算P(user1=user2)作为相似性得分,度量两者之间的人设相似性,如果相似性得分大于预定义的阈值,则认为该候选集回复反映了相似的个性化设定信息,进而根据相似性得分选择人设信息较为相似的回复,看作该用户的个性化相似回复,来做数据增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111337315.1/1.html,转载请声明来源钻瓜专利网。