[发明专利]事件图谱的构建方法、装置及电子设备有效

专利信息
申请号: 201911041241.X 申请日: 2019-10-29
公开(公告)号: CN110781317B 公开(公告)日: 2022-03-01
发明(设计)人: 李娟慧;吴信东;张杰 申请(专利权)人: 北京明略软件系统有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35;G06F40/279;G06F16/951
代理公司: 北京超成律师事务所 11646 代理人: 刘静
地址: 100000 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 事件 图谱 构建 方法 装置 电子设备
【说明书】:

发明提供了一种事件图谱的构建方法、装置及电子设备,涉及信息挖掘技术领域,包括获取目标事件的多个目标事件文本;对目标事件文本进行元事件抽取,得到多个原始元事件;原始元事件包括第一事件关键词;基于预设的事理图谱和第一事件关键词从所有原始元事件中确定与事理图谱匹配的多个目标元事件;其中,事理图谱包括按照事件因果关系和/或事件时序关系连接的事件;根据目标元事件对事理图谱中的事件进行更新,得到目标事件文本对应的事件图谱。本发明能够减小生成事件图谱的复杂度,提升事件图谱的获取效率和事件追踪能力。

技术领域

本发明涉及信息挖掘技术领域,尤其是涉及一种事件图谱的构建方法、装置及电子设备。

背景技术

随着互联网的发展,当出现某个新闻事件(如火灾事件)时,关于该事件的报道文本数据规模大且分散,这给追踪查询新闻事件带来了很大的障碍。

目前通过构建事件图谱实现事件追踪的方式主要有如下两种。一种是先抽取多个元事件,再抽取各元事件之间的关系。然而事件关系抽取十分复杂,传统的基于模板的关系抽取拓展性差,基于监督学习的方法需要大量标注好的训练样本,非常耗时。另一种主要通过多个复杂的公式定义不同元事件之间的关系。为了定义不同的关系需要调试不同的参数,这样不但会在定义关系过程中会花费较多时间,而且定义的关系是有限的,很难刻画更复杂的关系。

因此,采用上述方式构建事件图谱十分复杂,导致事件追踪能力较差,使得用户获取事件信息的效率不高。

发明内容

本发明的目的在于提供事件图谱的构建方法、装置及电子设备,能够减小生成事件图谱的复杂度,提升事件图谱的获取效率和事件追踪能力。

本发明提供的事件图谱的构建方法,包括:获取目标事件的多个目标事件文本;对所述目标事件文本进行元事件抽取,得到多个原始元事件;所述原始元事件包括第一事件关键词;基于预设的事理图谱和所述第一事件关键词从所有所述原始元事件中确定与所述事理图谱匹配的多个目标元事件;其中,所述事理图谱包括按照事件因果关系和/或事件时序关系连接的事件;根据所述目标元事件对所述事理图谱中的事件进行更新,得到所述目标事件文本对应的事件图谱。

进一步,所述对所述目标事件文本进行元事件抽取,得到多个原始元事件的步骤,包括:根据预设的文本分词方法对所述目标事件文本进行拆解,得到所述目标事件文本对应的多个分词;其中,所述预设的文本分词方法包括:基于词典的文本分词方法、基于统计的文本分词方法或基于机器学习的文本分词方法;对多个所述分词中的停用词进行过滤,将过滤后的分词确定为关键词;采用机器学习算法对各所述关键词进行抽取,得到多个原始元事件;其中,所述机器学习算法包括以下任意一种:支持向量机、条件随机场和隐马尔科夫模型;所述原始元事件包括所述第一事件关键词和事件元素,且所述事件元素包括以下一种或多种:时间元素、地点元素、角色元素、事件主题元素和动作元素。

进一步,所述方法还包括:对所述原始元事件进行关联,生成所述目标事件文本对应的元事件图谱。

进一步,所述事理图谱包括第二事件关键词;所述基于预设的事理图谱和所述第一事件关键词从所有所述原始元事件中确定与所述事理图谱匹配的多个目标元事件的步骤,包括:通过word2vec模型对所述第一事件关键词进行映射,得到所述第一事件关键词对应的第一词向量;通过所述word2vec模型对所述第二事件关键词进行映射,得到所述第二事件关键词对应的第二词向量;计算多个所述第一词向量和多个所述第二词向量两两之间的相似度;基于计算得到的相似度和预设的相似度阈值,从所有所述原始元事件中确定与所述事理图谱匹配的多个目标元事件;其中,每个所述目标元事件与所述事理图谱中的一个所述第二事件关键词匹配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911041241.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top