[发明专利]一种基于图文融合的生成式摘要生成方法有效

申请号：	201910764261.3	申请日：	2019-08-19
公开（公告）号：	CN110704606B	公开（公告）日：	2022-05-31
发明（设计）人：	曹亚男;徐灏;尚燕敏;刘燕兵;谭建龙;郭莉	申请（专利权）人：	中国科学院信息工程研究所
主分类号：	G06F16/34	分类号：	G06F16/34;G06F16/35;G06F16/36;G06T11/60
代理公司：	北京君尚知识产权代理有限公司 11200	代理人：	司立彬
地址：	100093 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于图文融合生成摘要方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图文融合的生成式摘要生成方法，其步骤包括：

1)将给定的文本数据集划分为训练集、验证集和测试集；其中，文本数据集中的每一样本是一三元组(X,I,Y)，X是文本，I是文本X对应的图像，Y是文本X的摘要；生成式摘要模型包含特征提取模块、特征融合模块以及摘要生成模块；

2)特征提取模块使用区域卷积神经网络捕获每一图像的实体特征，然后选取区域最大的前三个实体特征作为候选区域；然后生成该图像全局特征的图像特征和三个候选区域的图像特征；然后将所述图像特征转换为与文本同维度的图像特征向量；

3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练；其中进行训练时，对于同一样本，特征融合模块将该样本对应的文本向量和该样本对应的图像特征向量进行拼接，得到向量化表示的训练集、验证集和测试集；然后从向量化表示的训练集中选取k个样本依次输入到编码器中，得到文本和图像的联合编码h_s，通过中间语义向量c_t，计算解码器的隐状态h_t，从而实现特征融合；然后摘要生成模块使用融合的特征生成摘要；

4)输入一条文本和对应图像并生成该图像的图像特征向量，然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型，得到该文本对应的摘要。

2.如权利要求1所述的方法，其特征在于，图像特征向量包括图像全局特征向量和图像中最大区域的三个实体向量。

3.如权利要求1所述的方法，其特征在于，所述特征融合的方法为：在编码阶段当前时刻i的隐层输出为联合编码h_s，在编码阶段当前时刻i解码器的隐状态为h_t，通过转移矩阵W_a计算当前状态下的h_t与h_s的关联程度score(h_t，h_s)并对其归一化得到a_t(s)，然后计算中间语义向量c_t＝a_t(s)·h_s，及解码器的隐状态