[发明专利]基于元数据模型的工程领域知识图谱构建方法在审
申请号: | 202110431458.2 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113010696A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 杜续;苏辉;焦宝;时波;杨石飞;许丽萍 | 申请(专利权)人: | 上海勘察设计研究院(集团)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/25;G06F16/21 |
代理公司: | 上海申蒙商标专利代理有限公司 31214 | 代理人: | 黄明凯 |
地址: | 200093*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据模型 工程 领域 知识 图谱 构建 方法 | ||
本发明公开了一种基于元数据模型的工程领域知识图谱构建方法,包括以下步骤:汇总工程项目中的各类基础数据以构建业务数据源;基于业务数据源中的各类基础数据构建知识图谱本体层,包括本体、本体属性以及本体关系;基于知识图谱本体层构建元数据层,元数据层包括若干个元数据模型;构建数据任务层,包括数据提取任务、数据清洗任务以及数据存储任务;构建知识图谱存储层,以存储由数据任务层所构建的知识图谱;构建知识图谱应用层,知识图谱应用层包括数据获取接口、数据看板以及数据血缘展示模块。本发明的优点是:基于元数据模型,提出了对工程领域数据的校核、追溯及同步方法,高效地实现知识图谱的标准化构建、管理与应用。
技术领域
本发明属于数据处理技术领域,具体涉及一种基于元数据模型的工程领域知识图谱构建方法。
背景技术
构建工程领域知识图谱时,需要处理大量与工程业务相关的基础数据。业务数据具有来源多样异构、正确性不定,并随企业业务进行不定时更新等特点。采用常规技术手段构建工程领域知识图谱时存在以下难点:
构建知识图谱本体层时,需要将多源异构的业务基础数据进行整理清洗,难以保证知识图谱中数据的正确性和完备性;
当业务数据更新时,会涉及多个本体数据的更新,知识图谱的知识同步过程较为繁琐,一定程度上存在知识滞后的情况;
此外,当业务中需要使用知识图谱中的数据时,图谱数据的读取过程对业务操作人员不友好,存取效率及数据安全性难以保证。
为解决构建工程领域知识图谱的上述难点,本发明基于元数据模型,提出了对工程领域数据的校核、追溯及同步方法,高效地实现知识图谱的标准化构建、管理与应用。
发明内容
本发明的目的是根据上述现有技术的不足之处,提供一种基于元数据模型的工程领域知识图谱构建方法,该方法通过基于元数据模型,提出了对工程领域数据的校核、追溯及同步方法,高效地实现知识图谱的标准化构建。
本发明目的实现由以下技术方案完成:
一种基于元数据模型的工程领域知识图谱构建方法,其特征在于所述构建方法包括以下步骤:
(1)汇总工程项目中的各类基础数据以构建业务数据源;
(2)基于所述业务数据源中的各类基础数据构建知识图谱本体层,所述知识图谱本体层包括本体、本体属性以及本体关系;
(3)基于所述知识图谱本体层构建元数据层以定义所述业务数据源与所述知识图谱本体层之间的映射关系,其中,所述元数据层包括若干个元数据模型,各所述元数据模型分别对应不同的应用场景;
(4)构建数据任务层,所述数据任务层包括数据提取任务、数据清洗任务以及数据存储任务;
(5)构建知识图谱存储层,以存储由所述数据任务层所构建的知识图谱;
(6)构件知识图谱应用层,所述知识图谱应用层包括数据获取接口、数据看板以及数据血缘展示模块。
所述基础数据包括勘察数据、监测数据、施工数据以及设计数据。
所述元数据模型包含有若干个在业务逻辑上相关联的字段,所述字段具有统一的数据规范标准,所述数据规范标准包括字段命名标准、字段说明、字段数据类型规范、数据存储位置以及数据血缘;所述字段具有对应的数据处理方法的声明。
所述字段数据类型规范用以描述所述字段的标准数据存储类型,所述标准数据存储类型包括基本数据类型和集合数据类型,所述基本数据类型为int、float或string,所述集合数据类型为列表、哈希表或元组。
所述数据血缘为所述字段之间的相互依赖关系。
所述数据任务层中的所述数据提取任务、所述数据清洗任务以及所述数据存储任务分别具有各自的数据处理方法。
所述数据提取任务的数据处理方法是从所述业务数据源中全量或增量地提取源数据,并对所述源数据进行字段拆分、空值处理以及重复数据处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海勘察设计研究院(集团)有限公司,未经上海勘察设计研究院(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110431458.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无边框水滴同步转动机构
- 下一篇:信息处理方法、服务器以及电子设备