[发明专利]更新句子生成模型的方法以及句子生成设备在审
申请号: | 201810478297.0 | 申请日: | 2018-05-18 |
公开(公告)号: | CN109670147A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 李镐式;罗辉栋 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F17/20 | 分类号: | G06F17/20;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 姜长星;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码模型 句子生成 句子 奖励信息 目标句子 更新 设备提供 重新设置 权重 关联 配置 | ||
提供一种更新句子生成模型的方法以及句子生成设备。一种更新句子生成模型的方法包括:使用第一解码模型生成与源句子对应的目标句子;使用第二解码模型,来计算与目标句子相关联的奖励信息,其中,第二解码模型被配置为以与由第一解码模型生成的句子的次序不同的次序生成句子;基于计算的奖励信息,重新设置第一解码模型中的每个节点的权重。
本申请要求于2017年10月16日提交到韩国知识产权局的第10-2017-0133971号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用合并于此。
技术领域
下面的描述涉及一种更新用于生成句子的句子生成模型的方法以及使用句子生成模型生成句子的方法。
背景技术
近来,已经积极开展了关于使用神经网络生成句子的技术的研究。该技术应用于各种应用,诸如,生成原始句子的翻译句子的翻译器以及与用户对话的会话代理。用于该技术的神经网络模拟以数学表达式表示的人的生物神经元的特性,并使用模仿人的学习能力的算法。神经网络可具有响应于尚未用于学习或训练的输入模式基于学习或训练的结果生成相对正确的输出的泛化能力。
发明内容
提供本发明内容从而以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意图标识要求保护的主题的关键特征或必要特征,也不意图用于帮助确定要求保护的主题的范围。
在一个总体方面,一种更新句子生成模型的方法包括:使用第一解码模型生成与源句子对应的目标句子;使用被配置为以与由第一解码模型生成的句子的次序不同的次序生成句子的第二解码模型,来计算与目标句子相关联的奖励信息;基于计算的奖励信息,重新设置第一解码模型中的每个节点的权重。
计算奖励信息的步骤可包括:基于从第二解码模型生成包括在目标句子中的每个词的概率,来计算奖励信息。
计算奖励信息的步骤还可包括:使用源句子和在先前时间从第二解码模型输出的第一词,计算在当前时间从第二解码模型生成第二词的概率。
计算奖励信息的步骤可包括:使用包括在目标句子中的词以与目标句子中的所述词的次序不同的次序排列的序列,来计算奖励信息。
第一解码模型可以是包括循环神经网络(RNN)的前向解码模型,第二解码模型可以是包括RNN的后向解码模型。
重新设置权重的步骤可包括:使用第一解码模型,计算与目标句子相关联的策略信息;使用计算的策略信息和计算的奖励信息,重新设置与预设条件对应的权重。
计算策略信息的步骤可包括:基于从第一解码模型生成包括在目标句子中的每个词的概率,来计算策略信息。
计算策略信息的步骤还可包括:使用源句子和在先前时间从第一解码模型输出的第一词,计算在当前时间从第一解码模型生成第二词的概率。
计算权重的步骤可包括:重新设置使由奖励信息和与多个目标句子中的每个目标句子相关联的策略信息定义的目标函数最大化的权重。可使用第一解码模型从源句子生成所述多个目标句子。
计算权重的步骤可包括:重新设置使由目标函数和从第一解码模型生成源句子的预定正确句子的概率定义的损失函数最小化的权重。这里,可使用第一解码模型从源句子生成多个目标句子,可由奖励信息和与所述多个目标句子中的每个目标句子相关联的策略信息来定义目标函数。
生成目标句子的步骤可包括:基于响应于源句子从第一解码模型输出的最终结果值中的在预设范围内的最终结果值,生成多个目标句子。
生成目标句子的步骤可包括:基于响应于源句子中的词在第一时间从第一解码模型输出的输出值,生成多个目标句子。计算奖励信息的步骤可包括:使用第二解码模型,计算与在第一时间生成的所述多个目标句子相关联的奖励信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810478297.0/2.html,转载请声明来源钻瓜专利网。