[发明专利]一种开放域下的事件抽取系统和方法在审
申请号: | 202011472752.X | 申请日: | 2020-12-15 |
公开(公告)号: | CN112487171A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 成清;黄金才;程光权;杜航;胡星辰 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/279;G06N3/04;G06N3/08 |
代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 开放 事件 抽取 系统 方法 | ||
本发明提供一种开放域下的事件抽取系统和方法,一种开放域下的事件抽取系统,所述事件抽取系统包括事件抽取框架,领域规则模块和人机交互模块,所述事件抽取框架用于建立训练模型和框架对需求序列进行捕捉抽取,所述领域规则模块用于建立多种训练规则并融入训练模型,丰富事件抽取框架的抽取精度,所述人机交互模块用于反馈系统抽取信息和抽取状态信息,所述事件抽取框架包括自注意力层和门卷积层,所述自注意力层用于对抽取需求进行捕捉和筛选,所述门卷积层利用卷积网络用于依据抽取需求序列在开放域下对需求序列进行提取,所述卷积神经网络具体为门控卷积神经网络,本发明用于对开放域下的事件进行高精度抽取。
技术领域
本发明涉及事件抽取技术领域,具体为一种开放域下的事件抽取系统和方法。
背景技术
事件抽取技术是从非结构化信息中抽取出用户感兴趣的事件,并以结构化呈现给用户。事件抽取任务可分解为4个子任务:触发词识别、事件类型分类、论元识别和角色分类任务。其中,触发词识别和事件类型分类可合并成事件识别任务。事件识别判断句子中的每个单词归属的事件类型,是一个基于单词的多分类任务。论元识别和角色分类可合并成论元角色分类任务。角色分类任务则是一个基于词对的多分类任务,判断句子中任意一对触发词和实体之间的角色关系。
互联网应用的快速发展使得网络获取的数据量也大幅度的增加。如何快速、高效的从大规模数据中分析出真正有用的信息显得尤为重要而迫切。信息抽取这一研究领域在此背景下应运而生。而事件抽取作为信息抽取的一项子任务,不仅依赖于基础的自然语言处理技术,而且对分词、词性标注、命名实体识别、句法分析等结果也有所依赖。但不能单纯的理解为信息检索或浅层语义理解,而是需要去挖掘句子背后隐藏的真正含义。因此,作为信息抽取任务中一个至关重要的研究点,事件抽取技术方面的研究将变得任重而道远。传统的事件抽取研究所采用的语料大多都是面向限定域,而且必须事先给定事件类别,而后利用机器学习或者模式匹配算法进行事件类别识别以及事件元素识别工作。所以,传统的事件抽取方法在处理领域移植问题时的效果不佳。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种开放域下的事件抽取系统和方法,以解决上述背景技术中提出的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种开放域下的事件抽取系统,所述事件抽取系统包括事件抽取框架,领域规则模块和人机交互模块,所述事件抽取框架用于建立训练模型和框架对需求序列进行捕捉抽取,所述领域规则模块用于建立多种训练规则并融入训练模型,丰富事件抽取框架的抽取精度,所述人机交互模块用于反馈系统抽取信息和抽取状态信息。
优选的,所述事件抽取框架包括自注意力层和门卷积层,所述自注意力层用于对抽取需求进行捕捉和筛选,所述门卷积层利用卷积网络用于依据抽取需求序列在开放域下对需求序列进行提取。
优选的,所述卷积网络具体为门控卷积神经网络,所述门控卷积神经网络在每层卷积操作后设有一个输出卷积门限,控制信息流动。
优选的,所述领域规则模块包括有多种抽取规则,所述抽取规则有关键词抽取、相关词抽取、组合式抽取和自定义抽取。
优选的,所述组合式抽取包括关键词抽取、相关词抽取、自定义抽取之间任意两两结合进行抽取。
优选的,所述自定义抽取可依据开放域结构不同进行自定义抽取程序。
优选的,所述人机交互模块还包括有输入模块和输出模块,所述输入模块包括有输入设备以及生物识别装置,所述输出模块包括显示设备和音频输出模块。
优选的,所述抽取状态包括有抽取数据列表以及识别的关联数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011472752.X/2.html,转载请声明来源钻瓜专利网。