[发明专利]一种用于公共安全领域大数据知识图谱的自动化构建方法有效
申请号: | 201811532180.2 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109710701B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 李存冰 | 申请(专利权)人: | 浪潮软件股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 冯春连 |
地址: | 271000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 公共安全 领域 数据 知识 图谱 自动化 构建 方法 | ||
本发明公开一种用于公共安全领域大数据知识图谱的自动化构建方法,涉及数据挖掘、人工智能技术领域,包括该构建方法首先需要针对公共安全所涉及领域建立标准体系,随后建立公共安全领域实体映射库Entity‑Mapping,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联,前期准备工作完成后,将数据抽象成实体、关系、事件三大类,依托机器学习和深度学习服务,通过知识建模、知识抽取、实体融合依次完成公共安全领域知识图谱的自动化构建;另外,在实现自动化构建能力之外,还进行知识图谱的质量管控和优化,还构建公共安全领域搜索意图解析器,促进用户搜索智能化推荐,提高用户搜索获取有效信息的效率。
技术领域
本发明涉及数据挖掘、人工智能技术领域,具体的说是一种用于公共安全领域大数据知识图谱的自动化构建方法。
背景技术
信息技术的发展不断推动着互联网技术的变革,搜索引擎由于使得用户寻找信息的范围缩小,已经成为人们查找海量信息不可或缺的工具。
知识图谱的概念在2012年由谷歌公司最先提出,谷歌公司想在知识图谱项目的基础上,构建新一代的智能化搜索引擎。该搜索引擎的思想是从网页上获得各类知识的实体、属性信息,以及各实体之间的关联关系,从而建立知识的语义网络。传统的搜索引擎都是基于字符串的搜索,而不是根据相应的语义信息进行搜索,因此传统的搜索引擎可能会搜索出与语义毫不相关的信息,而仅仅包含该字符串,而基于知识图谱的搜索是基于语义分析的,因而搜索更加精确。
知识图谱的构建对于知识的展示与检索具有很高的研究价值,在国内百度和搜狗分别推出了“知心”和“知立方”来改善其搜索质量。清华大学建立了第一个大规模中英文跨语言知识图谱XLore,中科院在开放网络的基础上研发了“人立方、事立方、知立方”的原型系统。
目前随着中国经济的高速发展以及对外经济的持续开放,结合近几年在公共安全领域内恐暴事件来看,传统公共安全领域业务面临作案手法高科技化、多样化、智能化的挑战,因此知识图谱越来越受到人们的关注。但目前知识图谱在公共安全领域内如何构建还没有成熟技术。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种用于公共安全领域大数据知识图谱的自动化构建方法。
本发明的一种用于公共安全领域大数据知识图谱的自动化构建方法,解决上述技术问题采用的技术方案如下:
一种用于公共安全领域大数据知识图谱的自动化构建方法,其实现过程包括:
步骤一,根据公共安全所涉及领域建立标准体系,确保多源异构数据的融汇贯通和深度智能挖掘有章可循;
步骤二,建立公共安全领域实体映射库Entity-Mapping,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联;
步骤三,将数据抽象成实体、关系、事件三大类,构建公共安全领域知识图谱:
1)通过知识建模工具对公共安全领域所有数据资源进行数据地图分类展示,通过人机协同模式进行语料标注不同数据资源对应数据的实体类型,如人、案件、物品、地点、机构,根据数据元标准自动化标准不同实体的关联规则和标签规则,通过数据地图自动显示不同实体之间的关联关系;
2)依托机器学习和深度学习服务,从关系型数据库、开放知识库、半结构化网页、纯文本中进行文本深度挖掘,提取出结构化的实体、属性以及实体间的关系、事件,并在此基础上形成本体化的知识表达;
3)对多源知识进行实体融合,消除矛盾和歧义,解决同名实体产生歧义的问题,完成公共安全领域知识图谱的构建。
可选的,所涉及自动化构建方法的实现过程还包括:
通过权威度、冗余度、多样性、一致性进行知识验证,判断新知识是否正确;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811532180.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置