[发明专利]一种事理知识图谱构建方法及系统有效
申请号: | 201711293661.8 | 申请日: | 2017-12-08 |
公开(公告)号: | CN108052576B | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 王丽宏;李晨;贺敏;毛乾任;聂健;钟盛海;刘靖;马宏远;刘玮 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/215;G06F16/35;G06F16/36;G06Q50/00 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 陈英 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事理 知识 图谱 构建 方法 系统 | ||
本发明涉及一种事理知识图谱构建方法及系统,该构建系统包括:宏观事件层构建模块、微观知识层构建模块、关系映射模块、本体层构建模块和事理知识图谱生成模块;所述宏观事件层构建模块包括:事件实体抽取单元、事件演化单元和因果关系抽取单元;所述微观知识层构建模块包括:微观实体抽取单元。本发明通过从结构化数据中获取事件实体和微观实体,分别构建宏观事件层和微观实体层,并抽取不同事件实体之间的因果关系映射到微观实体中,通过对微观实体层中微观实体的关系、类型和因果关系进行抽象和归纳,由此判断事件形成突发性群体响应的本质原因,对突发事件进行预警预测。
技术领域
本发明涉及信息挖掘技术领域,尤其涉及一种事理知识图谱构建方法及系统。
背景技术
随着虚拟化、云计算等互联网技术的广泛应用,特别是社会化媒体,诸如微博、微信等在民众中的飞速发展与广泛普及,网络空间较现实社会更频繁的成为个体交流和情感表达的场所。以世界著名的在线社交网站Facebook为例,2011年底其月活跃用户已达8.45亿,而在2014年,微信的月活跃用户数超过8.06亿(2014年全国人口为13.68亿人)。覆盖面如此广泛的社会化媒体一方面能够大幅度降低获取信息的难度,为人们日常工作生活带来便利;另一方面也由于管控成本及时效的原因,导致部分携带虚假、负面信息的内容极易大范围扩散,乃至形成一些应激突发性的恶性群体性事件。
近年来,知识图谱相关技术由于其广泛的应用场景与灵活高效的归纳、推理、分析手段而广为人知。作为知识图谱技术的原始模型,1977年E.A.Feigenbaum首次提出知识工程的概念并通过恰当利用计算机处理分析特定专业领域数据来解决实际应用。2012年,谷歌基于大量前期研究与应用提出了知识图谱项目,其最初目标为满足用户智能搜索需求,为用户提供附带推理分析功能的智能搜索结果。在此基础上,伴随着大量相关应用于研究发现,知识图谱附带的本体层能够有效归纳知识的本质特征,为实现基于知识的推理提供了保证。但知识图谱的结构与构建方式需要根据实际的应用环境进行有针对性的调整,才能真正付诸使用。
发明内容
为了解决现有技术存在的问题,本发明的至少一个实施例提供了一种事理知识图谱构建方法,包括:
从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,通过聚合演化使所述宏观事件层内的事件实体之间形成事件演化链,并基于事件演化链抽取事件实体之间的因果关系;
从所述结构化数据中抽取微观实体组成微观知识层,根据事件实体与微观实体之间的映射关系,将所述因果关系映射到所述微观知识层;
对所述微观知识层的微观实体和微观实体间的因果关系进行抽象和归纳,形成事理知识本体层,由所述宏观事件层、微观知识层和事理知识本体层构成事理知识图谱。
可选的,所述通过知识抽取技术从所述结构化数据中抽取微观实体组成微观知识层,具体包括:
通过命名实体识别、实体间关系抽取和实体属性抽取技术从所述结构化数据中抽取实体、实体间关系和实体属性,组成包括所述实体、实体间关系和实体属性的微观实体,并通过所述微观实体组成微观知识层。
可选的,所述从所述结构化数据中抽取微观实体组成微观知识层,还包括:
对抽取得到的所述实体和实体间关系进行指代消歧和共指消解处理;
基于预存储的实体关系的连通图对所述实体进行关系预测,得到预测实体间关系,并将所述预测实体间关系添加到所述实体间关系中。
可选的,从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,具体包括:
对所述结构化数据进行快速事件检测得到所有待处理事件实体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711293661.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:流体控制装置以及泵
- 下一篇:一种用于远真视频会议的显示摄像一体设备