[发明专利]一种问题生成方法、装置、设备及存储介质有效
申请号: | 202010169926.9 | 申请日: | 2019-05-27 |
公开(公告)号: | CN111414464B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 高一帆;李丕绩 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06N3/084 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问题 生成 方法 装置 设备 存储 介质 | ||
1.一种问题生成方法,其特征在于,所述方法包括:
通过第一编码模型对参考文本对应的第一词向量、答案信息向量、和当前问答轮数对应的文本位置向量进行编码处理,得到第一语义向量序列;
通过第二编码模型对历史问答文本对应的第二词向量进行编码处理,得到第二语义向量序列;
通过解码模型对所述第一语义向量序列和所述第二语义向量序列进行解码处理,得到所述当前问答轮数对应的问题文本;
输出所述问题文本;
获取所述问题文本对应的答题文本;
当所述答题文本和预设的答案文本满足匹配关系时,将所述当前问答轮数的取值更新为下一问答轮数的取值;
当所述答题文本和所述答案文本不满足匹配关系时,保持所述当前问答轮数的取值。
2.根据权利要求1中所述的方法,其特征在于,所述方法还包括:
获取参考文本中各个分词对应的原始词向量和属性信息,其中,所述属性信息表征所述分词是否为答案;
当所述分词的属性信息表明所述分词不为答案时,将所述分词对应的原始词向量映射为第一词向量;
当所述分词的属性信息表明所述分词为答案时,将所述分词对应的原始词向量映射为答案信息向量。
3.根据权利要求1中所述的方法,其特征在于,所述通过第一编码模型对获取到的参考文本对应的第一词向量、答案信息向量、当前问答轮数对应的文本位置向量进行编码处理,得到第一语义向量序列,包括:
将所述第一词向量、答案信息向量和文本位置向量进行拼接得到拼接向量;
通过所述第一编码模型将所述拼接向量转换为具有固定长度的中间向量;
在所述中间向量中编码所述拼接向量的序列信息,得到第一语义向量序列。
4.根据权利要求1中所述的方法,其特征在于,所述通过解码模型对所述第一语义向量序列和所述第二语义向量序列进行解码处理,得到所述当前轮数对应的问题文本,包括:
通过解码模型对所述第一语义向量序列和第二语义向量序列,进行逐词解码;
在逐词解码过程中,将所述解码模型的篇章位置注意力分布集中在所述当前轮数对应的文本中,以及
当解码输出代词时,将所述解码模型的注意力分布集中到第二语义向量序列中的实体名词,以使得生成所述当前轮数对应的指代对齐的问题文本。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
获取初始的解码模型和训练文本对应的第三语义向量序列;
通过所述解码模型对所述第三语义向量序列进行解码、且确定需要生成代词时,根据第一优化目标函数,对所述解码模型的参数进行调整,以使所述解码模型的注意力分布集中到实体名词。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
至少根据第一优化目标函数和第二优化目标函数对所述解码模型进行联合训练,以对所述解码模型的参数进行调整;
其中,所述第一优化目标函数用于在需要生成代词时,将所述解码模型的注意力分布集中到实体名词,第二优化目标函数用于优化每一轮问答对话对应的篇章位置注意力分布,以使得所述解码模型的篇章位置注意力分布集中到当前问答轮数对应的文本。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
将所述参考文本划分为至少两个部分,并获取各个部分在所述参考文本中的位置信息;
基于问答轮数和各个部分之间的对应关系,确定当前问答轮数对应的部分,和所述部分对应的位置信息;
基于所述部分对应的位置信息确定所述当前问答轮数对应的文本位置信息;
根据当前问答轮数对应的文本位置信息生成所述当前问答轮数对应的文本位置向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010169926.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种目标物预警监测的方法和装置
- 下一篇:一种护照信息快速采集验证装置