[发明专利]一种基于深度学习和内容规划的文本自动生成方法及装置有效

专利信息
申请号: 202110488572.9 申请日: 2021-05-06
公开(公告)号: CN113065336B 公开(公告)日: 2022-11-25
发明(设计)人: 郑海涛;柏杨;李自然;沈颖;肖喜;江勇;夏树涛 申请(专利权)人: 清华大学深圳国际研究生院
主分类号: G06F40/216 分类号: G06F40/216;G06F16/26;G06K9/62;G06N3/04;G06N3/08
代理公司: 深圳新创友知识产权代理有限公司 44223 代理人: 江耀纯
地址: 518055 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 内容 规划 文本 自动 生成 方法 装置
【权利要求书】:

1.一种基于深度学习和内容规划的文本自动生成方法,其特征在于:具体包括以下步骤:

S1、将输入数据进行层次化编码表示;

S2、将层次化编码表示后的输入数据进行粗粒度的规划和细粒度的规划,所述的粗粒度的规划是对输入数据从属性级别进行排序和内容挑选,所述细粒度的规划是对每条属性中的所有词的重要性进行建模,对重要性高的词给予更高的权重;

S3、对进行粗粒度的规划和细粒度的规划后的输入数据进行解码并生成文本;

所述的步骤S3是通过基于自注意力机制和双重注意力机制的解码器来实现的;具体的工作过程如下:首先通过单向的自注意力层得到一个隐状态,然后双重注意力机制通过输入数据的属性级别的编码信息计算注意力,然后对词级别的编码信息计算注意力,将属性级别的注意力权重和词级别的注意力权重相乘及归一化之后,得到修正后的词级别的注意力权重,并解码生成文本;

计算方式如下

ht=Multihead(ht-1,ht-1,ht-1),

其中Multiheadγ表示使用修正的词级别注意力权重来计算词级别注意力;通过这种方式,相当于在每一步解码过程中先看需要选择哪一条属性,然后进一步从这个属性中选择需要的词;

然后通过一个门结构对上面的三个隐状态进行融合,计算方式如下:

dt=rh*gh+(1-gh)*ht

最后通过一个线性层和Softmax激活函数后,得到该步目标词的概率:

p(yt|y<t,z,x)=softmax(dtWy),

训练过程是采用最大似然估计来最大化这个概率进行训练,同时和规划过程进行联合训练,直至收敛。

2.根据权利要求1所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:步骤S1所述的将输入数据进行层次化编码表示,具体如下:首先将输入数据中的词通过嵌入层表示为向量,然后使用分层自注意力机制对输入数据进行编码和表示。

3.根据权利要求2所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:所述的使用分层自注意力机制对输入数据进行编码和表示,具体步骤如下:首先通过多个不共享参数的多头自注意力层对输入数据中的每个属性进行分别表示,挖掘同一属性中不同词之间的依赖关系;另外通过每个属性中的所有词的向量表示求平均得到每个属性的向量表示。

4.根据权利要求1所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:所述的粗粒度的规划是通过基于自注意力机制的指针网络实现的,首先采用基于双向自注意力机制的编码器挖掘不同属性之间的依赖关系并对输入的属性进行编码,然后采用基于单向自注意力机制的解码器解码,最后通过指针注意力模块指向输入的属性,从而对输入的属性进行排序。

5.根据权利要求4所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:在每一步采用基于单向自注意力机制的解码器解码过程中,首先得到解码器输出的隐状态,然后通过指针注意力模块来计算该步要指向每个输入属性的概率,根据指针网络得到的概率分布,并得到一个指向输入属性的指针索引,根据所述索引构建邻接矩阵并对输入的属性进行排序。

6.根据权利要求1所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:所述的细粒度的规划是采用有监督的选择注意力机制来实现的,通过注意力的方式对每个词的重要性进行建模,并鼓励模型给重要性高的词以更高的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110488572.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top