[发明专利]用于生成模型的方法和装置有效
申请号: | 201810719830.8 | 申请日: | 2018-07-03 |
公开(公告)号: | CN110737758B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 孙明明;李旭;李平 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 模型 方法 装置 | ||
1.一种用于生成模型的方法,包括:
获取样本集,所述样本集中包括样本语句以及与样本语句对应的标注知识;
从所述样本集中选取样本,以及执行以下训练步骤:将选取的样本中的样本语句输入第一初始模型,生成与样本语句对应的第一预测知识;将第一预测知识输入第二初始模型,生成与第一预测知识对应的第一预测语句;将标注知识输入第二初始模型,生成与标注知识对应的第二预测语句;将第二预测语句输入第一初始模型,生成与第二预测语句对应的第二预测知识;根据以下信息项确定第一奖励信号:第一预测知识符合预设的知识表达规则的程度、第一预测知识与标注知识的相似度、第二预测知识为标注知识的概率;根据所确定的第一奖励信号利用强化学习方法训练得出第一模型。
2.根据权利要求1所述的方法,其中,所述训练步骤还包括:
根据以下信息项中的至少一项确定第二奖励信号:第二预测语句符合预设的语言表达规则的程度、第二预测语句与样本语句的相似度、第一预测语句为样本语句的概率;
根据所确定的第二奖励信号利用强化学习方法训练得出第二模型。
3.根据权利要求2所述的方法,其中,所述第一初始模型包括编码器和解码器;以及
所述将选取的样本中的样本语句输入第一初始模型,生成与样本语句对应的第一预测知识,包括:
根据样本语句构造输入序列;
利用所述编码器将输入序列映射为输入隐状态序列,利用所述解码器将输出序列映射为输出隐状态序列;
利用解码器对所述输入隐状态序列进行解码,生成预测状态序列;
根据所述预测状态序列得到第一预测知识。
4.根据权利要求3所述的方法,其中,所述利用解码器对所述输入隐状态序列进行解码,生成预测状态序列,包括:
对于待生成的预测状态序列中的目标位置,获取所述解码器的隐藏层在解码得出所述目标位置的上一个位置的预测状态后的状态,作为所述解码器的当前隐状态;
基于所述当前隐状态计算所述输入隐状态序列中各输入隐状态与待生成的预测状态序列中目标位置的预测状态之间的匹配度;
基于匹配度计算各所述输入隐状态对所述目标位置的预测状态的注意力权重;
对各所述输入隐状态按照所述注意力权重进行加权求和得到上下文向量;
基于所述上下文向量、所述输出隐状态序列中目标位置的上一个位置的输出隐状态、以及所述解码器的隐藏层在解码所述目标位置的预测状态时的状态,计算出所述目标位置的预测状态的概率分布;
根据所述概率分布,确定出所述目标位置的预测状态。
5.根据权利要求4所述的方法,其中,所述目标位置的预测状态的概率为:从对应的样本语句中拷贝目标词语作为所述输出序列中的目标对象的概率与从预设符号集合中选择出目标符号并将目标符号所表征的对象作为所述输出序列中的对象的概率之和;
所述预设符号集合中的符号用于与所述样本语句中的词语联合,以完整表征所述样本语句中的以下知识中的一项:基于动词或介词的知识、基于名词属性的知识、实体的描述知识以及实体与概念的关系知识。
6.根据权利要求5所述的方法,其中,所述方法还包括:
响应于从对应的样本语句中拷贝目标词语作为所述输出序列中的一个对象,将从对应的样本语句中拷贝所述目标词语作为所述输出序列中的一个对象的概率更新为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810719830.8/1.html,转载请声明来源钻瓜专利网。