[发明专利]一种融合语义场景的摘要自动生成方法及系统有效

专利信息
申请号: 202110412989.7 申请日: 2021-04-16
公开(公告)号: CN113326866B 公开(公告)日: 2022-05-31
发明(设计)人: 关勇;李茹;郭少茹;谭红叶;张虎 申请(专利权)人: 山西大学
主分类号: G06K9/62 分类号: G06K9/62;G06F40/30
代理公司: 太原申立德知识产权代理事务所(特殊普通合伙) 14115 代理人: 郭海燕
地址: 030006*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 语义 场景 摘要 自动 生成 方法 系统
【权利要求书】:

1.一种融合语义场景的摘要自动生成方法,其特征在于,包括以下步骤:

步骤1,在图构建单元使用汉语框架网标注工具抽取文章X中的框架场景其中Nf表示文章中框架的个数,Fi指文章中第i个框架,Fi又由相应的框架元素构成,其中Nfe指框架Fi中的框架元素个数,使用文章中框架及框架元素构建语义场景图Gs,利用文章中框架的目标词和框架元素的填充词构建词关系图Gw

步骤2,在文章编码单元将文章X={w1,w2,…,wi…,wl}输入预训练模型BERT,获取文章向量表示Cb=[x1,x2,…,xi…,xl],其中,xi表示文章中第i个词wi的向量表示,l表示文章的长度;

步骤3,在图编码单元将步骤1得到的词关系图Gw和语义场景图Gs分别输入图编码层,分别得到其对应的向量表示hw和hs

所述词关系图Gw通过编码得到其向量表示hw的具体过程为:

(1)其中,和分别表示节点和边,Nv和Ne分别代表节点的个数和边的个数,每一个节点都是文章X中的一个文本块,mv和nv分别表示文本块的开始和结束位置,平均文本块中每个词的向量表示得到该节点初始化向量

(2)利用基于Gated Graph Neural Network的K层的图编码模块更新所有的节点,得到最终Gw的表示hw=hk,其中,hk指第k层图编码模块所有节点的隐藏状态,具体更新过程为:

图编码模块的第k层输入是上一层的输出第k层每个节点状态由以下公式更新:

其中,指节点vi在第k层图编码模块的隐藏状态,R指边的类型集合,Ni是节点vi的邻居节点,Wr是可学习的参数,是一个激活函数,是注意力权重

其中,exp指以自然常数e为底的指数函数,指节点vi在第k-1层图编码模块的隐藏状态,指节点vj在第k-1层图编码模块的隐藏状态;

所述语义场景图Gs通过编码得到其向量表示hs的具体过程为:通过预训练模型BERT分别编码框架和框架元素的定义得到其节点的初始化向量,利用基于Gated GraphNeuralNetwork的K层的图编码模块更新所有的节点,得到最终语义场景图Gs的向量表示hs

步骤4,根据步骤3得到的hw和hs,在图交互单元计算hw对hs的影响,得到最终的图向量表示hg

所述得到最终的图向量表示hg的过程为:

使用自注意力机制计算hw对hs的影响:

hg=α·hw

其中,(hw)T是hw的转置矩阵,dw是hw的维度,α是权重向量,hg是最终的图向量表示;

步骤5,在特征融合单元根据步骤2得到的文章向量表示cb和步骤4得到的图向量表示hg,经过特征融合模块,获取最终的文章表示C;

所述获得最终的文章表示C的过程为:

首先,针对文章X中的每一个词wi,从节点中查找包含wi的所有节点,表示为其中,Nsel表示包含wi的节点个数,

然后,将当前wi的表示xi拼接上所有包含wi节点的平均表示,得到最终的文章表示C

步骤6,在解码单元,结合之前得到的文章表示C生成摘要,

所述在解码单元生成摘要的过程为:

构建基于Transformer的解码层,由文章表示C和上一步解码步骤的输出[y1,y2,…,yt-1]计算得到当前解码状态st

由以下公式计算得到下一个词yt的概率

其中,W和b为可以学习的参数,t为每一个解码步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110412989.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top