[发明专利]一种公安专题知识图谱系统的构建方法在审
申请号: | 201811326924.5 | 申请日: | 2018-11-08 |
公开(公告)号: | CN111159418A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 朱彤;张丹普 | 申请(专利权)人: | 北京航天长峰科技工业集团有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/25 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公安 专题 知识 图谱 系统 构建 方法 | ||
本发明提供一种公安专题知识图谱系统的构建方法,基于人、事、地、物、组织构建包含社会关系网络与事件的知识图谱,实现高效线索研判和深度挖掘预警,包括案件线索解析、人案关系智能推演、犯罪团伙挖掘、时空轨迹比对、高危人员预测预警、情报数据挖掘分析等,降低公安人员与后期研发人员工作量。
技术领域
本发明涉及公共安全技术领域,具体涉及一种公安专题知识图谱系统的构建方法。
背景技术
公安部门的网络普遍存在业务数据机密性要求高、业务连续性要求强、网络结构相对封闭、信息系统架构形式多样等特点,而公安内部网络中不同业务功能模块的信息安全需求又各不相同:如面向互联网的便民服务信息系统具有相对开放的结构特点,用户一般为普通民众,便民服务业务对数据的可用性和完整性要求往往大于其对机密性要求;而独立运行的业务信息系统具有相对封闭的结构特点,用户一般为内部用户,用户对数据的完整性和保密性要求往往大于可用性要求。
因此,公安网络安全风险贯穿公安内部网络和互联网,可以认为:外部网络面临的服务中断、外部攻击、非法入侵、安全漏洞等威胁的概率比较大;而内部网络面临的敏感数据泄露、监管审计不到位等威胁概率比较大。
目前公安内部网络和外部网络的安全控制与措施大多独立考虑,导致只解决了局部问题,未能从整体解决安全问题,从而降低了整体的安全效率,导致多个信息安全孤岛。因此,传统的安全防护系统已经难以满足内控与合规管理要求,主要面临以下新的问题:
安全架构日趋复杂、新型技术不断涌现;
不但有传统物理服务器、网络设备和安全设备,也有虚拟服务器和虚拟设备;不仅有C/S,B/S架构传统应用,也有云平台和大数据应用;
安全数据快速增长,数据快速处理能力不足;
每台物理设备每天生成5万至50万条安全事件,全网带宽也从百兆提升至千兆,每年需处理的安全数据在10TB数量级,而现有安防系统的处理能力仍停留在1TB数量级,无法快速提取有价值的数据进行分析;
安全处理能力分散,未能形成整合优势;
现有安全处理方式仍然按照防火墙、病毒防范、行为审计等独立事件进行处理,未能整合安全事件之间的相互关系、行为关联来产生总体安全态势,缺乏科学决策依据。
发明内容
本发明的目的在于针对公安安全面临的诸多问题,采用大数据整合公安方面海量数据,构建面向实战的全息画像和知识图谱系统。
本发明的技术方案如下:
一种公安专题知识图谱系统的构建方法,其特征在于,包括:
(1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive中,作为知识图谱的数据源;
(2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
(3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
(4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
(5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
(6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长峰科技工业集团有限公司,未经北京航天长峰科技工业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811326924.5/2.html,转载请声明来源钻瓜专利网。