[发明专利]事件抽取方法、装置、系统和存储介质有效
申请号: | 201710530618.2 | 申请日: | 2017-07-03 |
公开(公告)号: | CN107562772B | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 吴刚 | 申请(专利权)人: | 南京柯基数据科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/34;G06F16/35;G06F40/205;G06F40/211;G06F40/289;G06F40/295 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 贺琳 |
地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 抽取 方法 装置 系统 存储 介质 | ||
本发明公开了一种事件抽取方法、装置、系统和存储介质。该方法包括:利用对语料库进行模式学习得到的触发词,定位语料库的文档中的事件句,并根据触发词的关系分类确定事件句的事件类别;使用模式学习得到的模式,模式匹配事件句,得到与模式相匹配的事件句集;根据预设的与事件类别对应的事件学习模板,抽取事件句集中的事件内容。根据本发明实施例提供的事件抽取方法,可以提高事件内容抽取的效率和完整性。
技术领域
本发明涉及信息抽取领域,尤其涉及事件抽取方法、装置、系统和存储介质。
背景技术
作为信息抽取的重要组成部分,事件抽取具有广阔的应用前景和巨大的现实意义,并且在自动文摘、自动问答、情报研究和信息检索等领域有着广泛的应用。事件抽取的主要目的是把包含事件的非结构化文本以结构化的形式呈现出来。
事件抽取通常可以分为元事件(Meta Event)抽取和主题事件(Topic Event)抽取。其中,元事件表示一个动作的发生或者状态的变化,包括参与该动作的一系列成分例如时间、地点、主体和客体等。元事件是主题事件的基本组成单位。
事件抽取是信息处理领域的关键技术,目前事件抽取的主要方法包括基于模式匹配的元事件抽取。基于模式匹配方法对事件的识别和抽取是在一些模式的指导下完成的,抽取时需要通过模式匹配算法找出符合模式约束条件的信息即可。
但是,基于模式匹配方法需要大量的人工建立模式,模式的创建者需要较高的技能水平。随着互联网技术的发展,WEB文本不断丰富,面对大规模语料,人工建立模式的数量较大,使用模式匹配的方法显得费时费力,且人工建立的模式往往比较片面且不够准确,从而可能导致抽取的事件内容不够完整和准确。
发明内容
本发明实施例提供事件抽取方法、装置、系统和存储介质,可以提高事件内容抽取的效率和完整性。
根据本发明实施例的一方面,提供一种事件抽取方法,包括:利用对语料库进行模式学习得到的触发词,定位语料库的文档中的事件句,并根据触发词的关系分类确定事件句的事件类别;使用模式学习得到的模式,模式匹配事件句,得到与模式相匹配的事件句集;根据预设的与事件类别对应的事件学习模板,抽取事件句集中的事件内容。
根据本发明实施例的另一方面,提供一种事件抽取装置,包括:事件句定位及分类模块,用于利用对语料库进行模式学习得到的触发词,定位语料库的文档中的事件句,并根据触发词的关系分类确定事件句的事件类别;事件句匹配模块,用于使用模式学习得到的模式,模式匹配事件句,得到与模式相匹配的事件句集;事件内容抽取模块,用于根据预设的与事件类别对应的事件学习模板,抽取事件句集中的事件内容。
根据本发明实施例的再一方面,提供一种事件抽取系统,包括:存储器,用于储存可执行程序代码;处理器,用于读取存储器中存储的可执行程序代码以执行上述的事件抽取方法。
根据本发明实施例的又一方面,提供一种计算机可读存储介质,该计算机可读存储介质包括指令,当该指令在计算机上运行时,使得计算机执行上述各方面所述的方法。
根据本发明实施例的事件抽取方法、装置、系统和存储介质,利用模式学习得到的触发词定位所述语料库的文档中的事件句并对定位到的事件分类;并利用学习得到的模式,对定位到的事件句进行模式匹配,根据每种事件类别对应的事件学习模板学习事件内容。根据本发明实施例的事件抽取方法,在学习到新模式之后使用模式和模板学习结合的方式从文本中抽取相关的内容,提高了事件识别的效率,有利于提高事件识别的完整性和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出根据本发明一实施例的事件抽取方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京柯基数据科技有限公司,未经南京柯基数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710530618.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理过程动态回溯追踪方法
- 下一篇:刮水片装置