[发明专利]一种基于模板的序列生成模型生成问题的方法及装置在审
申请号: | 202110181755.6 | 申请日: | 2021-02-09 |
公开(公告)号: | CN112836482A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 李玉娥;董黎刚;蒋献;吴梦莹;诸葛斌 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/30;G06F16/36;G06F16/35 |
代理公司: | 杭州五洲普华专利代理事务所(特殊普通合伙) 33260 | 代理人: | 朱林军 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 序列 生成 模型 问题 方法 装置 | ||
1.一种基于模板的序列生成模型生成问题的方法,其特征在于,
构建文本抽取模型:对用于生成问题的文本输入到联合模型中,利用所述联合模型对所述文本进行分类,得到预测文本;
构建文本关系识别模型:根据所述预测文本内容获取文本语义特征向量,利用带有关系标签的训练集训练所述文本关系识别模型,其中根据所述文本关系识别模型中设置的字词级和语句级的注意力机制对所述文本语义特征向量进行训练,可获得字向量和词向量对应的输入序列,根据所述对应的输入序列对所述字向量和词向量进行分类,获取预测文本的预测关系标签;
构建序列生成模型,所述序列生成模型包括编码单元和模板解码单元,输入问题给所述编码单元,并根据所述问题语义映射成对应的多元组向量,并将所述多元组向量依次输入到模板解码单元中,且由模板解码单元输出为问题模板,根据所述预测关系标签对所述问题模板进行替换。
2.根据权利要求1所述的一种基于模板的序列生成模型生成问题的方法,其特征在于,所述文本关系识别模型包括输入表示层、字词级层、语句级层以及实体关系分类层,其中,
输入层用于将输入的文字转换成向量的表示,用于获取文本语义特征向量;
字词级层学习用于学习所述文本上下文的内容信息,得到每个字词对文本语义信息的重要程度;
语句级层学习用于根据上下文语句,给每个输出字词分配不同的权重,获取字词对语句信息的重要程度;
实体关系分类层对语句信息的重要程度进行归一化处理,得到向量的关系标签,从而对实体间的关系进行分类。
3.如权利要求1所述的一种基于模板的序列生成模型生成问题的方法,其特征在于,构建所述文本抽取模型步骤包括:
所述联合模型为双向长短记忆网络模型和条件随机场模型的联合结构,所述文本抽取模型包括字词向量表示、语句特征提取和语句级的序列标注三层结构,
其中对所述文本数据进行序列标注得到训练集文本,
读取所述训练集文本作为双向长短记忆网络模型的输入进行无监督训练,使得双向长短记忆网络模型初始化所述训练集文本的权值以及构建特征空间;
基于所述特征空间和文本的权值,利用条件随机场模型对所述训练集文本进行有监督学习;
使用归一化函数获得所述训练集文本中各个字词的分类概率;
利用得到的分类概率进行分类得到所述预测文本。
4.如权利要求1所述的一种基于模板的序列生成模型生成问题的方法,其特征在于,构建文本关系识别模型步骤包括:
将所述预测文本内容输入到预训练的Word2vec模型中将文字转换成低维稠密的向量表示,其中所述向量表示为文本语义特征向量,将所述文本语义特征向量输入至构建文本关系识别模型的字词级层中,获得所述文本语义特征向量包含的字义信息、词义信息和上下文信息。
5.如权利要求1所述的一种基于模板的序列生成模型生成问题的方法,其特征在于,构建文本关系识别模型步骤还包括:
获得文本语义特征向量后,将所述文本语义特征向量输入至构建文本关系识别模型的语句级学习层中,获得所述文本语义特征向量每个字词的权值,根据加权平均值法得到每个字词的attention值;
对所述attention值进行归一化处理,得到所述文本语义特征向量的预测关系标签,根据所述预测关系标签对所述预测文本进行分类得到语句实体。
6.如权利要求1所述的一种基于模板的序列生成模型生成问题的方法,其特征在于,所述预测关系标签采用HowNet定义的16种标签和5种自定义标签。
7.如权利要求1所述的一种基于模板的序列生成模型生成问题的方法,其特征在于,将所述输入问题映射成对应的多元组向量时的内容至少包括主题实体、实体关系、实体,其中所述输入问题是根据所述主题实体和所述实体关系提出,且能由所述实体回答。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110181755.6/1.html,转载请声明来源钻瓜专利网。