[发明专利]一种公共安全知识图谱构建的方法有效
申请号: | 201811305793.2 | 申请日: | 2018-11-05 |
公开(公告)号: | CN109446343B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 周龙;谢赟;尹淑平 | 申请(专利权)人: | 上海德拓信息技术股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02;G06Q50/26 |
代理公司: | 上海湾谷知识产权代理事务所(普通合伙) 31289 | 代理人: | 张恒 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公共安全 知识 图谱 构建 方法 | ||
1.一种公共安全知识图谱构建的方法,其特征在于,包括:
步骤一,根据公共安全领域所涵盖的数据来源以及业务特征进行本体建模;
步骤二,从当前公共安全数据源进行知识抽取;
步骤三,通过图数据库、关系型数据库以及文档数据库相结合的方式对抽取的知识进行存储;
步骤四,将从各数据源采集的知识进行知识融合;
步骤五,对完成知识融合的知识图谱进行知识加工;
所述的步骤一中,本体建模采用自顶向下与自底向上相结合的构建方式,包括:
步骤S11,采用自顶向下的构建方式进行类以及类层次的构建:采用公共安全“人、事、物、点、组织”基本要素作为基础类,再根据数据源特征以及实际业务,从基础类开始,以多叉树的结构进行展开,构建类之间的层级关系,直到最小粒度;类以及类层次关系构建完毕后,进一步的构建类的交叉关系,包括互斥、交集、并集、补集以及继承关系;
步骤S12,采用自顶向下与自底向上相结合的方式进行关系以及关系关联的构建:首先通过自顶向下的方式对基础的抽象关系进行构建,包括从属关系、互斥关系、等价关系以及冲突关系;再采用自底向上的方式,对于关系型数据源抽取其关联外键构建实例关系,非关系型数据源采用语义依存构建实例关系,且每一种实例关系至少对应一种抽象关系;
步骤S13,采用自底向上的方式进行实体与属性构建:对于关系型数据源直接从数据表字段中抽取实体与属性,而对于非关系型数据源则通过语义依存分析进行聚类分析抽取实体与属性,且每个属性至少对应一个实体,每个实体至少属于一个类。
2.根据权利要求1所述的公共安全知识图谱构建的方法,其特征在于,所述步骤二中,知识抽取的数据源包括关系型数据以及非关系型数据;知识抽取的内容包含:实体、属性和关系;
其中,关系型数据源的知识抽取采用数据治理以及资源描述框架技术,非关系型数据源知识抽取采用文本语义分析提取技术;对于抽取实体、关系以及属性,根据不同的数据来源以及抽取方式标识置信度。
3.根据权利要求2所述的公共安全知识图谱构建的方法,其特征在于,知识抽取的数据源中,关系型数据来自于数据仓库以及各业务系统数据库,非关系型数据来自文案、新闻;置信度的计算中,数据仓库的数据源视为完全信任,置信度为100,各业务系统数据库的置信度根据实际的数据完善度进行计算;而非关系型数据源,依据具体的知识抽取结果的质量评估进行计算。
4.根据权利要求1所述的公共安全知识图谱构建的方法,其特征在于,所述步骤三中,数据存储模式采用雪花型存储模式,以图数据库为中心,进行类以及类层级、实体以及实体的唯一标识、关系的存储;关系型数据库以及文档数据库作为外围数据存储,关系型数据库存储属性以及属性的层级关系,文档数据库存储文本以及文本关键词;关系型数据库、文档数据库通过实体的唯一标识与图数据库进行关联。
5.根据权利要求1所述的公共安全知识图谱构建的方法,其特征在于,所述步骤四中,知识融合指:通过实体链接标识相似实体,关联相同实体的不同表达形式;并对相同实体的不同属性或者相同实体相同属性不同的属性值进行合并,同时去掉重复的实体、属性以及关系;具体包括:
步骤S41,对于全部共同唯一性属性值完全相同的两个实体,判断其共同非唯一性属性的值,当非唯一性属性值相同率达到某一阈值后,标识为相同实体;
步骤S42,对于部分共同唯一性属性值完全相同的两个实体,标识为实体冲突关系;
步骤S43,对于共同唯一性属性值完全不同,但非唯一性属性值相同率达到某一阈值的两个实体,标识为相似实体;
步骤S44,对于所述步骤S41中相同的实体,判断当前实体与目标实体是否都存在某一属性,若存在,则将属性的值进行合并后去重,若不存在,则将当前实体的属性以及属性值添加到目标实体;
步骤S45,对于所述步骤S41中相同的实体,判断当前实体与目标实体是否存在关联到某实体的相同关系,若不存在,则将目标实体与某实体关联此关系;对于当前实体与目标实体与某实体关联关系存在冲突的,将当前实体与目标实体取消相同实体标识,标识为冲突实体;
步骤S46,对于所述步骤S45中完成关系合并的当前实体,删除其重复实体、属性以及关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德拓信息技术股份有限公司,未经上海德拓信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811305793.2/1.html,转载请声明来源钻瓜专利网。