[发明专利]一种文本生成方法、装置及存储介质在审
申请号: | 202011625631.4 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112613282A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 蔡晓东;高铸成 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 尉保芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 生成 方法 装置 存储 介质 | ||
1.一种文本生成方法,其特征在于,包括如下步骤:
导入多个数据集,并分别对各个所述数据集进行拼接计算,得到与各个所述数据集对应的数据集嵌入向量;
构建训练模型,根据多个所述数据集嵌入向量和多个所述数据集对所述训练模型进行参数更新,得到更新后的训练模型;
根据所述更新后的训练模型对待训练文本进行训练,得到生成文本。
2.根据权利要求1所述的文本生成方法,其特征在于,所述分别对各个所述数据集进行拼接计算,得到与各个所述数据集对应的数据集嵌入向量的过程包括:
通过第一式分别对各个所述数据集进行拼接计算,得到与各个所述数据集对应的数据集嵌入向量,所述第一式为:
rj=ReLU(Wr[rj,1;rj,2;...;rj,K]+br),
其中,rj为第j个数据集嵌入向量,ReLU为激活函数,Wr为权重矩阵,[rj,1;rj,2;...;rj,K]为第j个数据集中的数据,br为偏置向量,[;]为向量之间的拼接。
3.根据权利要求1所述的文本生成方法,其特征在于,所述构建训练模型,根据多个所述数据集嵌入向量和多个所述数据集对所述训练模型进行参数更新,得到更新后的训练模型的过程包括:
基于0penNMT-py编解码模型构建训练模型,所述训练模型包括编码层和解码层;
分别将各个所述数据集嵌入向量输入至所述编码层中,通过所述编码层分别对各个所述数据集嵌入向量进行编码分析,得到多个数据集更新向量;
将多个所述数据集更新向量输入至所述解码层中,通过所述解码层对多个所述数据集更新向量进行最终文本的计算,得到最终文本和多个文本原始概率;
根据所述最终文本对多个所述文本原始概率进行损失计算,得到更新损失函数;
根据所述更新损失函数对所述训练模型进行训练,得到更新后的训练模型。
4.根据权利要求3所述的文本生成方法,其特征在于,所述通过所述编码层分别对各个所述数据集嵌入向量进行编码分析,得到多个数据集更新向量的过程包括:
分别将各个所述数据集嵌入向量输入至隐藏层中,通过所述预建隐藏层分别对各个所述数据集嵌入向量进行编码处理,得到多个数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量;
分别对各个所述数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量进行内容筛选的计算,得到多个数据集更新向量。
5.根据权利要求4所述的文本生成方法,其特征在于,所述分别将各个所述数据集嵌入向量输入至隐藏层中,通过所述预建隐藏层分别对各个所述数据集嵌入向量进行编码处理,得到多个数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量的过程包括:
通过第二式分别对各个所述数据集嵌入向量进行均值池化编码,得到多个数据集编码向量,所述第二式为:
其中,rj为第j个数据集嵌入向量,Meanpooling为均值池化,为第j个数据集编码向量;
分别对各个所述数据集嵌入向量进行隐藏信息提取,得到与所述数据集编码向量对应的隐藏层输出向量。
6.根据权利要求5所述的文本生成方法,其特征在于,所述分别对各个所述数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量进行内容筛选的计算,得到多个数据集更新向量的过程包括:
通过第三式分别对各个所述数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量进行计算,得到多个数据集更新向量,所述第三式为:
其中,
其中,hn为隐藏层输出向量,Ws和Us均为权重矩阵,为第j个数据集编码向量,⊙为元素点乘,ej为第j个数据集更新向量,σ为sigmoid函数,b为偏置向量,sGate为选择门。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011625631.4/1.html,转载请声明来源钻瓜专利网。