[发明专利]经济领域知识图谱事件关系自动抽取的方法和装置在审

专利信息
申请号: 201911400041.9 申请日: 2019-12-30
公开(公告)号: CN111159428A 公开(公告)日: 2020-05-15
发明(设计)人: 刘粉香;贠瑞峰;刘彬彬;彭翔;张炎红;陆军 申请(专利权)人: 智慧神州(北京)科技有限公司
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 霍文娟
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 经济 领域 知识 图谱 事件 关系 自动 抽取 方法 装置
【权利要求书】:

1.一种经济领域知识图谱事件关系自动抽取的方法,其特征在于,包括:

获取原始数据,所述原始数据为经济金融领域的数据;

根据事件知识图谱基础架构以及所述原始数据,构建所述事件知识图谱,所述事件知识图谱包括主题事件;

将所述主题事件按时间排序;

对排序后的所述主题事件按照预定时间窗口分组为多个事务,至少一个所述事务包括主题事件;

基于所述事务,采用频繁项集挖掘算法挖掘关联规则;

采用机器学习算法确定所挖掘的所述关联规则的关联关系,所述关联关系为事件关系。

2.根据权利要求1所述的方法,其特征在于,所述主题事件有多个,构建所述事件知识图谱之前,所述方法还包括:

确定元事件、不同的所述主题事件之间的关系、所述主题事件与实体的关系、实体属性以及事件属性;

根据所述元事件、不同的所述主题事件之间的关系、所述主题事件与实体的关系、所述实体属性以及所述事件属性,更新主题事件、所述实体、事件属性值以及实体属性值。

3.根据权利要求1所述的方法,其特征在于,基于所述事务使用频繁项集挖掘算法,挖掘关联规则,包括:

基于所述事务使用频繁项集挖掘算法,确定所述事务的所有频繁项集;

根据所述频繁项集利用频繁项集生成规则,挖掘置信度高的所述关联规则。

4.根据权利要求3所述的方法,其特征在于,所述频繁项集包括第一频繁项集和第二频繁项集,根据所述频繁项集利用频繁项集生成规则,挖掘置信度高的所述关联规则之后,且在采用机器学习算法确定所挖掘的所述关联规则的关联关系,所述关联关系为事件关系之前,所述方法还包括:

确定第一概率和第二概率,所述第一概率为所述第一频繁项集出现的概率,所述第二概率为所述第二频繁项集出现的概率,所述第一频繁项集表示为X,所述第二频繁项集表示为Y;

确定预定规则的置信度,所述预定规则表示为X=Y;

确定所述预定规则的第一独立性;

确定所述预定规则的第二独立性。

5.根据权利要求4所述的方法,其特征在于,采用机器学习算法确定所挖掘的所述关联规则的关联关系,包括:

将所述第一频繁项集按所述时间排序并组合,确定第一频繁项集集合;

将所述第二频繁项集按所述时间排序并组合,确定第二频繁项集集合;

按照所述预定时间窗口对所述第一频繁项集集合和所述第二频繁项集集合分组,生成所述第一频繁项集集合的多个子集和所述第二频繁项集集合的多个子集;

确定所述第一频繁项集集合的子集发生的第一时间和所述第二频繁项集集合的子集发生的第二时间;

根据所述第一时间和所述第二时间生成所述预定规则对应的预定子规则;

采用机器学习算法确定所述预定子规则的关联关系。

6.根据权利要求5所述的方法,其特征在于,采用机器学习算法确定所述预定子规则的关联关系,包括:

对所述第一频繁项集集合的子集中的每个词和所述第二频繁项集集合的子集中的每个词进行嵌入,确定各所述词对应的第一嵌入向量;

将各所述第一嵌入向量的和对应的时间向量相加,得到第二嵌入向量;

根据所述第二嵌入向量和统计量得到第三嵌入向量,所述统计量由所述预定子规则对应的所述第一概率、所述第二概率、所述置信度、所述第一独立性和所述第二独立性组成;

将所述第三嵌入向量输入神经网络训练,确定所述预定子规则的关联关系。

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述原始数据包括至少以下之一:

经济金融领域权威网站信息、经济金融领域权威报纸信息、经济金融领域权威期刊信息、经济金融领域权威杂志信息。

8.根据权利要求1至6中任一项所述的方法,其特征在于,所述预定时间窗口包括至少以下之一:

一周、一个月、一季度、一年。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧神州(北京)科技有限公司,未经智慧神州(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911400041.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top