[发明专利]基于深度LSTM的多样性文本生成方法、系统与计算机可读介质在审

专利信息
申请号: 202210804801.8 申请日: 2022-07-08
公开(公告)号: CN115374271A 公开(公告)日: 2022-11-22
发明(设计)人: 刘华忠;符士鹏 申请(专利权)人: 江苏普旭科技股份有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06N3/04;G06N3/08;G06F40/242;G06F17/16
代理公司: 南京行高知识产权代理有限公司 32404 代理人: 王培松;王菊花
地址: 210006 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 lstm 多样性 文本 生成 方法 系统 计算机 可读 介质
【权利要求书】:

1.一种基于深度LSTM的多样性文本生成方法,其特征在于,包括:

步骤1、基于训练语料集生成字符字典以及训练文本序列;

步骤2、以训练文本序列作为LSTM模型的输入,通过模型训练获得深度LSTM文本生成模型;其中的深度LSTM文本生成模型的模型参数为多元正态分布N(μ,Σ),通过模型训练求解该多元正态分布的参数μ和Σ,从而获得深度LSTM文本生成模型,其中参数μ表示所述多元正态分布的期望,参数Σ表示所述多元正态分布的协方差矩阵;以及

步骤3、对于输入的预测文本序列,基于所述深度LSTM文本生成模型进行字符预测,生成新的字符,实现整个文本序列的生成。

2.根据权利要求1所述的基于深度LSTM的多样性文本生成方法,其特征在于,所述基于训练语料集生成字符字典以及训练文本序列,包括:

步骤1.1、对训练语料集进行切分,切分至字符级,然后对所有字符进行去重,得到字符词典V,词典长度为m;

步骤1.2、基于切分的字符,生成训练语料集的训练文本序列X,定义如下:

X=(x1,x2...,xl)

其中,训练文本序列的长度为l,xi为训练文本序列X的第i个字符。

3.根据权利要求1所述的基于深度LSTM的多样性文本生成方法,其特征在于,所述以训练文本序列作为LSTM模型的输入,通过模型训练获得深度LSTM文本生成模型,包括:

步骤2.1、初始化LSTM模型及模型参数θ;

步骤2.2、将训练文本序列作为LSTM模型的输入,利用LSTM模型基于训练文本序列X的前t个字符来预测第t+1个字符,输出第t+1个字符为词典中的某个字符的概率值;

步骤2.3、基于梯度下降法逐步降低模型的训练损失,求解出一组最优参数θ*,以θ*作为多元正态分布的期望;

步骤2.4、构造Hessian矩阵并对其取逆求得协方差矩阵。

4.根据权利要求3所述的基于深度LSTM的多样性文本生成方法,其特征在于,所述利用LSTM模型基于训练文本序列X的前t个字符来预测第t+1个字符,输出第t+1个字符为词典中的某个字符的概率值,包括:

通过以下公式求解第t+1个字符为词典中的第j个字符的概率值概率p(xt+1=vj|x1,...,xt):

其中,f表示LSTM模型,输出值表示LSTM模型f预测第t+1个字符为字符词典中第j个字符的概率值。

5.根据权利要求3所述的基于深度LSTM的多样性文本生成方法,其特征在于,所述基于梯度下降法逐步降低模型的训练损失,求解出一组最优参数θ*,包括:

首先,定义模型训练的损失函数L(θ)如下:

通过上述损失函数计算交叉熵损失,yt表示训练语料集中的t时刻的实际训练数据,即在训练文本序列在t时刻是否为词典中某一个字符,是则为1,否则为0;

然后,通过梯度下降计算逐步降低训练损失,求解出一组最优参数θ*,其中梯度下降的计算过程如下:

其中,n是迭代的次数,ɑ是步长,通过多次迭代计算,逐步更新参数θ,求得最优参数作为θ*,使得模型损失值最小,i=1,2,3,...,m,m表示字符字典的词典长度。

6.根据权利要求5所述的基于深度LSTM的多样性文本生成方法,其特征在于,所述构造Hessian矩阵并对其取逆求得协方差矩阵,包括:

首先,构造Hessian矩阵H如下:

其中,通过输入训练文本序列,以此更新Hessian矩阵中损失函数以及对应一组模型参数,对每次更新后的Hessian矩阵累加并取平均得到最终的Hessian矩阵;

然后,对最终的Hessian矩阵求逆即可得到多元正态分布的协方差矩阵Σ。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏普旭科技股份有限公司,未经江苏普旭科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210804801.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top