[发明专利]一种基于知识选择的对话模型及其训练方法在审
申请号: | 202211023548.9 | 申请日: | 2022-08-25 |
公开(公告)号: | CN115392263A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 叶剑;马占宇;刘剑峰;杨旭锐 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06N3/04;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 选择 对话 模型 及其 训练 方法 | ||
一种基于知识选择的对话模型,所述模型包括:编码模块,其包括文本编码器和知识编码器,所述文本编码器用于对提问者语句进行编码获得提问者语句编码向量,所述知识编码器用于对知识库中的知识进行编码获得知识编码向量;知识选择模块,用于根据编码模块获得的所述提问者语句编码向量和知识编码向量从知识库中为提问者语句选择知识,所述知识选择模块通过采用强化学习的方式以对话文本及其上下文为输入、为对话文本选择的知识为输出训练获得;解码模块,用于根据所述知识选择模块选择的知识与所述提问者语句编码向量进行解码生成提问者语句的回复语句。
技术领域
本发明涉及自然语言处理领域,具体来说,涉及一种人机对话系统,更具体地说,涉及一种应用了强化学习方法的基于知识选择的对话模型及其训练方法。
背景技术
目前有关自然语言处理(NLP)领域中的人机对话的生成方法已经开展了许多相关研究,其通常包含上游任务和下游任务,上游任务是将真实空间的文本信息编码到特征空间,即把提问者的话语编码为数字矩阵;下游任务则是从特征空间中把向量(数字矩阵)解码到真实空间中,即生成回复。基于知识选择的对话则是通过选择合适的知识与文本信息共同进行编解码以使生成的回复更加准确。
目前基于知识的对话已经得到了很多研究,包括收集新数据集或开发新模型,但大多数关于模型的工作很少对知识选择问题展开研究。例如:文献[1]讲述了采用外部知识记忆网络辅助Seq2Seq模型有效地结合给定的知识和对话上下文来提高响应的信息量的方案;文献[2]提出了一种增量转换器来编码多轮话语以及相关文档中的知识的方案;文献[3]提出了一种基于维基百科向导的数据集和一个模型以利用从池中选择知识并根据所选知识和给定上下文生成响应的方案;文献[4]提供一种关注两阶段基于知识的对话中的知识选择问题的方案;文献[5]提出采用BERT模型的方案,该模型是目前自然语言处理的主流预训练模型,其主要功能是作用于NLP上游任务,通常为编码文本信息的第一选择;文献[6]提出的方案中的Copy机制和文献[7]提出的方案中的Transformer解码器均是下游任务的种类。尽管目前已经提出的模型很多,但大部分模型的实际应用效果并不好,尤其是有关采用知识选择的方法。
目前已有的采用知识选择的对话生成方法大多没有考虑到多轮对话场景下知识选择的一致性、多轮对话的场景下已选择过的知识大概率不会重复使用以及没有充分地利用多轮对话场景下之前轮次已生成的回复。
综上所述,现有技术下的基于知识选择的对话生成方法存在以下缺点:
1、没有考虑多轮对话场景下知识选择的历史性,即已选择过的知识大概率不会再重复使用,如果考虑了知识选择的历史性,可以有效地提高知识选择的准确度。
2、没有充分利用多轮对话场景下之前轮次生成的回复(即上下文)来对当前轮次选择知识的过程进行调整与优化以生成更准确的回复。
参考文献列表:
文献[1]Marjan Ghazvininejad,Chris Brockett,Ming-Wei Chang,Bill Dolan,Jianfeng Gao,Wen-tau Yih,and Michel Galley.A Knowledge-Grounded NeuralConversation Model.In AAAI,2018.
文献[2]Zekang Li,Cheng Niu,Fandong Meng,Yang Feng,Qian Li,and JieZhou.Incremental Transformer with Deliberation Decoder for Document GroundedConversations.In ACL,2019b.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211023548.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种弹窗控制方法及系统
- 下一篇:消息中间件的性能监控方法和系统