[发明专利]基于多通道层次图注意力网络的开放事件抽取方法与系统有效

专利信息
申请号: 202210375116.8 申请日: 2022-04-11
公开(公告)号: CN114444473B 公开(公告)日: 2022-06-21
发明(设计)人: 万齐智;万常选;胡蓉;刘德喜;刘喜平 申请(专利权)人: 江西财经大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30
代理公司: 北京中济纬天专利代理有限公司 11429 代理人: 黄攀
地址: 330013 江西省南*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 通道 层次 注意力 网络 开放 事件 抽取 方法 系统
【说明书】:

发明提出一种基于多通道层次图注意力网络的开放事件抽取方法与系统,该方法包括:获取给定文档,根据给定文档建立得到文档句法依存树;基于文档句法依存树,依次按照调整依存结构、关联缺省成分、添加序列顺序以及关联祖先结点与后代结点的步骤,以构建得到双向依存图;基于原始图注意力网络,嵌入结点类型并进行层级调整,以改造原始图注意力网络的特征汇聚过程,进而构建得到层次图注意力网络;构建得到三通道图注意力网络;将给定文档中的词语,输入至三通道图注意力网络更新嵌入表示,并通过全连接网络进行四分类判断,以实现开放事件的抽取。本发明可有效增强图结构的特征编码能力。

技术领域

本发明涉及信息抽取技术领域,特别涉及一种基于多通道层次图注意力网络的开放事件抽取方法与系统。

背景技术

事件抽取作为信息抽取的关键基础任务,旨在从浩瀚的文本数据中抽取有价值的事件信息。毫无疑义的,事件抽取具有较大意义,可以帮助投资决策、风险分析、人们交谈方式的理解、案件推送以及辅助决策等。

目前,现有的针对开放事件抽取的研究工作中,有部分是采用远程监督和对抗技术检测不限定类型的事件;还有一部分是采用模式匹配的方法抽取三元组事件。

然而,上述的研究存在较大的局限性,事件检测只需要识别事件的触发词,不讨论事件论元的抽取;模式匹配的方法通常准确率高,其召回率一般较低,即只能适用于部分语料和场景。基于此,有必要开发出一种普遍适用的开放事件抽取策略,以帮助很多下游应用。

发明内容

鉴于上述状况,本发明的主要目的是为了提出一种基于多通道层次图注意力网络的开放事件抽取方法与系统,以解决上述的技术问题。

本发明实施例提出一种基于多通道层次图注意力网络的开放事件抽取方法,其中,所述方法包括如下步骤:

步骤一、获取给定文档,根据所述给定文档建立得到文档句法依存树;

步骤二、基于所述文档句法依存树,依次按照调整依存结构、关联缺省成分、添加序列顺序以及关联祖先结点与后代结点的步骤,以构建得到双向依存图;

步骤三、基于原始图注意力网络,嵌入结点类型并进行层级调整,以改造所述原始图注意力网络的特征汇聚过程,进而构建得到层次图注意力网络,其中所述结点类型包括自身结点、父结点、兄弟结点、子结点以及孙结点,嵌入结点类型并进行层级调整表示在所述原始图注意力网络中添加结点类型的权重以及添加结点层级的权重;

步骤四、基于所述层次图注意力网络,编码得到词语语义特征、句法依存关系类型特征以及词性特征,并根据所述词语语义特征、所述句法依存关系类型特征以及所述词性特征构建得到三通道图注意力网络,其中所述三通道图注意力网络包括词语语义图注意力网络、句法依存关系图注意力网络以及词语词性图注意力网络;

步骤五、将所述给定文档中的词语,输入至所述三通道图注意力网络更新嵌入表示,并通过全连接网络进行四分类判断,以实现开放事件的抽取,其中四分类包括主语、谓语、宾语及非主谓宾短语。

本发明提出一种基于多通道层次图注意力网络的开放事件抽取方法,基于句法依存树,设计双向依存图,能够有效增强图结构的特征编码能力;针对原始图注意力网络,通过嵌入结点类型并进行层级调整,以构建得到层次图注意力网络,使得结点特征在汇聚时能够捕获具有层级信息和结点类型信息的图结构;本发明单独地编码词语语义、依存关系类型和词性信息,使得每个通道既可以重点关注本身的主要特征,又可及时混入其它通道的特征进行补充。

所述基于多通道层次图注意力网络的开放事件抽取方法,其中,在所述步骤一中,所述文档句法依存树的构建方法包括如下步骤:

采用句法依存分析工具对所述给定文档进行分句以得到多个语句;

依次对所述给定文档中的每个语句进行句法结构解析,以得到语句的句法依存树;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西财经大学,未经江西财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210375116.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top