[发明专利]一种文本生成方法、装置及存储介质在审

专利信息
申请号: 202011625631.4 申请日: 2020-12-31
公开(公告)号: CN112613282A 公开(公告)日: 2021-04-06
发明(设计)人: 蔡晓东;高铸成 申请(专利权)人: 桂林电子科技大学
主分类号: G06F40/151 分类号: G06F40/151;G06F40/216;G06N3/04;G06N3/08
代理公司: 北京轻创知识产权代理有限公司 11212 代理人: 尉保芳
地址: 541004 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 生成 方法 装置 存储 介质
【权利要求书】:

1.一种文本生成方法,其特征在于,包括如下步骤:

导入多个数据集,并分别对各个所述数据集进行拼接计算,得到与各个所述数据集对应的数据集嵌入向量;

构建训练模型,根据多个所述数据集嵌入向量和多个所述数据集对所述训练模型进行参数更新,得到更新后的训练模型;

根据所述更新后的训练模型对待训练文本进行训练,得到生成文本。

2.根据权利要求1所述的文本生成方法,其特征在于,所述分别对各个所述数据集进行拼接计算,得到与各个所述数据集对应的数据集嵌入向量的过程包括:

通过第一式分别对各个所述数据集进行拼接计算,得到与各个所述数据集对应的数据集嵌入向量,所述第一式为:

rj=ReLU(Wr[rj,1;rj,2;...;rj,K]+br),

其中,rj为第j个数据集嵌入向量,ReLU为激活函数,Wr为权重矩阵,[rj,1;rj,2;...;rj,K]为第j个数据集中的数据,br为偏置向量,[;]为向量之间的拼接。

3.根据权利要求1所述的文本生成方法,其特征在于,所述构建训练模型,根据多个所述数据集嵌入向量和多个所述数据集对所述训练模型进行参数更新,得到更新后的训练模型的过程包括:

基于0penNMT-py编解码模型构建训练模型,所述训练模型包括编码层和解码层;

分别将各个所述数据集嵌入向量输入至所述编码层中,通过所述编码层分别对各个所述数据集嵌入向量进行编码分析,得到多个数据集更新向量;

将多个所述数据集更新向量输入至所述解码层中,通过所述解码层对多个所述数据集更新向量进行最终文本的计算,得到最终文本和多个文本原始概率;

根据所述最终文本对多个所述文本原始概率进行损失计算,得到更新损失函数;

根据所述更新损失函数对所述训练模型进行训练,得到更新后的训练模型。

4.根据权利要求3所述的文本生成方法,其特征在于,所述通过所述编码层分别对各个所述数据集嵌入向量进行编码分析,得到多个数据集更新向量的过程包括:

分别将各个所述数据集嵌入向量输入至隐藏层中,通过所述预建隐藏层分别对各个所述数据集嵌入向量进行编码处理,得到多个数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量;

分别对各个所述数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量进行内容筛选的计算,得到多个数据集更新向量。

5.根据权利要求4所述的文本生成方法,其特征在于,所述分别将各个所述数据集嵌入向量输入至隐藏层中,通过所述预建隐藏层分别对各个所述数据集嵌入向量进行编码处理,得到多个数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量的过程包括:

通过第二式分别对各个所述数据集嵌入向量进行均值池化编码,得到多个数据集编码向量,所述第二式为:

其中,rj为第j个数据集嵌入向量,Meanpooling为均值池化,为第j个数据集编码向量;

分别对各个所述数据集嵌入向量进行隐藏信息提取,得到与所述数据集编码向量对应的隐藏层输出向量。

6.根据权利要求5所述的文本生成方法,其特征在于,所述分别对各个所述数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量进行内容筛选的计算,得到多个数据集更新向量的过程包括:

通过第三式分别对各个所述数据集编码向量和与所述数据集编码向量对应的隐藏层输出向量进行计算,得到多个数据集更新向量,所述第三式为:

其中,

其中,hn为隐藏层输出向量,Ws和Us均为权重矩阵,为第j个数据集编码向量,⊙为元素点乘,ej为第j个数据集更新向量,σ为sigmoid函数,b为偏置向量,sGate为选择门。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011625631.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top