[发明专利]一种基于深度学习和内容规划的文本自动生成方法及装置有效
申请号: | 202110488572.9 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113065336B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 郑海涛;柏杨;李自然;沈颖;肖喜;江勇;夏树涛 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/26;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 内容 规划 文本 自动 生成 方法 装置 | ||
1.一种基于深度学习和内容规划的文本自动生成方法,其特征在于:具体包括以下步骤:
S1、将输入数据进行层次化编码表示;
S2、将层次化编码表示后的输入数据进行粗粒度的规划和细粒度的规划,所述的粗粒度的规划是对输入数据从属性级别进行排序和内容挑选,所述细粒度的规划是对每条属性中的所有词的重要性进行建模,对重要性高的词给予更高的权重;
S3、对进行粗粒度的规划和细粒度的规划后的输入数据进行解码并生成文本;
所述的步骤S3是通过基于自注意力机制和双重注意力机制的解码器来实现的;具体的工作过程如下:首先通过单向的自注意力层得到一个隐状态,然后双重注意力机制通过输入数据的属性级别的编码信息计算注意力,然后对词级别的编码信息计算注意力,将属性级别的注意力权重和词级别的注意力权重相乘及归一化之后,得到修正后的词级别的注意力权重,并解码生成文本;
计算方式如下
ht=Multihead(ht-1,ht-1,ht-1),
其中Multiheadγ表示使用修正的词级别注意力权重来计算词级别注意力;通过这种方式,相当于在每一步解码过程中先看需要选择哪一条属性,然后进一步从这个属性中选择需要的词;
然后通过一个门结构对上面的三个隐状态进行融合,计算方式如下:
dt=rh*gh+(1-gh)*ht,
最后通过一个线性层和Softmax激活函数后,得到该步目标词的概率:
p(yt|y<t,z,x)=softmax(dtWy),
训练过程是采用最大似然估计来最大化这个概率进行训练,同时和规划过程进行联合训练,直至收敛。
2.根据权利要求1所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:步骤S1所述的将输入数据进行层次化编码表示,具体如下:首先将输入数据中的词通过嵌入层表示为向量,然后使用分层自注意力机制对输入数据进行编码和表示。
3.根据权利要求2所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:所述的使用分层自注意力机制对输入数据进行编码和表示,具体步骤如下:首先通过多个不共享参数的多头自注意力层对输入数据中的每个属性进行分别表示,挖掘同一属性中不同词之间的依赖关系;另外通过每个属性中的所有词的向量表示求平均得到每个属性的向量表示。
4.根据权利要求1所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:所述的粗粒度的规划是通过基于自注意力机制的指针网络实现的,首先采用基于双向自注意力机制的编码器挖掘不同属性之间的依赖关系并对输入的属性进行编码,然后采用基于单向自注意力机制的解码器解码,最后通过指针注意力模块指向输入的属性,从而对输入的属性进行排序。
5.根据权利要求4所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:在每一步采用基于单向自注意力机制的解码器解码过程中,首先得到解码器输出的隐状态,然后通过指针注意力模块来计算该步要指向每个输入属性的概率,根据指针网络得到的概率分布,并得到一个指向输入属性的指针索引,根据所述索引构建邻接矩阵并对输入的属性进行排序。
6.根据权利要求1所述的一种基于深度学习和内容规划的文本自动生成方法,其特征在于:所述的细粒度的规划是采用有监督的选择注意力机制来实现的,通过注意力的方式对每个词的重要性进行建模,并鼓励模型给重要性高的词以更高的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110488572.9/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法