[发明专利]一种融合语义场景的摘要自动生成方法及系统有效
申请号: | 202110412989.7 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113326866B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 关勇;李茹;郭少茹;谭红叶;张虎 | 申请(专利权)人: | 山西大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 郭海燕 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 语义 场景 摘要 自动 生成 方法 系统 | ||
1.一种融合语义场景的摘要自动生成方法,其特征在于,包括以下步骤:
步骤1,在图构建单元使用汉语框架网标注工具抽取文章X中的框架场景其中Nf表示文章中框架的个数,Fi指文章中第i个框架,Fi又由相应的框架元素构成,其中Nfe指框架Fi中的框架元素个数,使用文章中框架及框架元素构建语义场景图Gs,利用文章中框架的目标词和框架元素的填充词构建词关系图Gw;
步骤2,在文章编码单元将文章X={w1,w2,…,wi…,wl}输入预训练模型BERT,获取文章向量表示Cb=[x1,x2,…,xi…,xl],其中,xi表示文章中第i个词wi的向量表示,l表示文章的长度;
步骤3,在图编码单元将步骤1得到的词关系图Gw和语义场景图Gs分别输入图编码层,分别得到其对应的向量表示hw和hs;
所述词关系图Gw通过编码得到其向量表示hw的具体过程为:
(1)其中,和分别表示节点和边,Nv和Ne分别代表节点的个数和边的个数,每一个节点都是文章X中的一个文本块,mv和nv分别表示文本块的开始和结束位置,平均文本块中每个词的向量表示得到该节点初始化向量
(2)利用基于Gated Graph Neural Network的K层的图编码模块更新所有的节点,得到最终Gw的表示hw=hk,其中,hk指第k层图编码模块所有节点的隐藏状态,具体更新过程为:
图编码模块的第k层输入是上一层的输出第k层每个节点状态由以下公式更新:
其中,指节点vi在第k层图编码模块的隐藏状态,R指边的类型集合,Ni是节点vi的邻居节点,Wr是可学习的参数,是一个激活函数,是注意力权重
其中,exp指以自然常数e为底的指数函数,指节点vi在第k-1层图编码模块的隐藏状态,指节点vj在第k-1层图编码模块的隐藏状态;
所述语义场景图Gs通过编码得到其向量表示hs的具体过程为:通过预训练模型BERT分别编码框架和框架元素的定义得到其节点的初始化向量,利用基于Gated GraphNeuralNetwork的K层的图编码模块更新所有的节点,得到最终语义场景图Gs的向量表示hs;
步骤4,根据步骤3得到的hw和hs,在图交互单元计算hw对hs的影响,得到最终的图向量表示hg;
所述得到最终的图向量表示hg的过程为:
使用自注意力机制计算hw对hs的影响:
hg=α·hw
其中,(hw)T是hw的转置矩阵,dw是hw的维度,α是权重向量,hg是最终的图向量表示;
步骤5,在特征融合单元根据步骤2得到的文章向量表示cb和步骤4得到的图向量表示hg,经过特征融合模块,获取最终的文章表示C;
所述获得最终的文章表示C的过程为:
首先,针对文章X中的每一个词wi,从节点中查找包含wi的所有节点,表示为其中,Nsel表示包含wi的节点个数,
然后,将当前wi的表示xi拼接上所有包含wi节点的平均表示,得到最终的文章表示C
步骤6,在解码单元,结合之前得到的文章表示C生成摘要,
所述在解码单元生成摘要的过程为:
构建基于Transformer的解码层,由文章表示C和上一步解码步骤的输出[y1,y2,…,yt-1]计算得到当前解码状态st,
由以下公式计算得到下一个词yt的概率
其中,W和b为可以学习的参数,t为每一个解码步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110412989.7/1.html,转载请声明来源钻瓜专利网。