[发明专利]一种基于模板的序列生成模型生成问题的方法及装置在审
申请号: | 202110181755.6 | 申请日: | 2021-02-09 |
公开(公告)号: | CN112836482A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 李玉娥;董黎刚;蒋献;吴梦莹;诸葛斌 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/30;G06F16/36;G06F16/35 |
代理公司: | 杭州五洲普华专利代理事务所(特殊普通合伙) 33260 | 代理人: | 朱林军 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 序列 生成 模型 问题 方法 装置 | ||
本发明公开了一种基于模板的序列生成模型生成问题的方法及系统,构建文本抽取模型对用于生成问题的文本进行分类,获得预测文本;构建文本识别模型,文本识别模型将文本转换成向量表示,基于向量表示和该模型中设置的字词级和语句级注意力机制,获得字向量和词向量对应的输入序列,基于所述输入序列进行分类得到预测文本的预测关系标签;构建序列生成模型,编码单元接收问题并映射成多元向量输入给模板解码单元,对此时解码单元输出的问题模板,根据所述预测根据所述预测关系标签对所述问题模板进行替换。
技术领域
本发明涉及人工智能自然语言处理技术领域,尤其涉及一种基于模板的序列生成模型生成问题的方法及装置。
背景技术
目前,在自然语言处理领域中对中文问题生成的研究很大一部分都是基于模板或者基于规则的模型构建的知识图谱,由于模板和规则的局限性,所生成的问题种类单一且语言缺乏灵活性。
基于规则的方法通常需要耗费大量的人力和时间,并且生成的问题通常存在语句不通顺,与文章内容不匹配的问题。基于模板的方法生成的问题比较死板,类型单一,缺乏语言的多样性,而且模板的好坏直接决生成问题的质量。单纯基于序列模型的问题生成方法存在主题实体识别不明确等问题,同样影响生成问题的质量。
发明内容
鉴于现有技术存在的上述问题,本发明设计了一种基于模板的序列生成模型生成问题的方法及装置,把基于模板和基于序列生成模型的方法结合在一起,在知识图谱中的序列生成模型中生成相关问题时,提高了生成问题的质量。
为实现上述目的,本发明提出了一种基于模板的序列生成模型生成问题的方法,包括:
构建文本抽取模型:对用于生成问题的文本内容输入到联合模型中,利用所述联合模型对所述文本进行分类,得到预测文本;
构建文本关系识别模型:根据所述预测文本内容获取文本语义特征向量,利用带有关系标签的训练集训练所述文本关系识别模型,其中根据所述文本关系识别模型中设置的字词级和语句级的注意力机制对所述文本语义特征向量进行训练,可获得字向量和词向量对应的输入序列,根据所述对应的输入序列对所述字向量和词向量进行分类,获取预测文本的预测关系标签;
构建序列生成模型,所述序列生成模型包括编码单元和模板解码单元,输入问题给所述编码单元,并根据所述问题语义映射成对应的多元组向量,并将所述多元组向量依次输入到模板解码单元中,且由模板解码单元的输出为问题模板,根据所述预测关系标签对所述问题模板进行替换。
可选的,所述文本关系识别模型包括输入表示层、字词级层、语句级层以及实体关系分类层,其中将文本语义信息对应的字向量和词向量序列,其中,
输入层用于将输入的文字转换成向量的表示,用于获取文本语义特征向量;
字词级层学习用于学习所述文本上下文的内容信息,得到每个字词对文本语义信息的重要程度;
语句级层学习用于根据上下文语句,给每个输出字词分配不同的权重,获取字词对语句信息的重要程度;
实体关系分类层对语句信息的重要程度进行归一化处理,得到向量的关系标签,从而对实体间的关系进行分类。
可选的,构建所述文本抽取模型步骤包括:
所述联合模型为双向长短记忆网络模型和条件随机场模型的联合结构,所述文本抽取模型包括字词向量表示、语句特征提取和语句级的序列标注三层结构,
其中对所述文本数据进行序列标注得到训练集文本,
读取所述训练集文本作为双向长短记忆网络模型的输入进行无监督训练,使得双向长短记忆网络模型初始化所述训练集文本的权值以及构建特征空间;
基于所述特征空间和文本的权值,利用条件随机场模型对所述训练集文本进行有监督学习;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110181755.6/2.html,转载请声明来源钻瓜专利网。