[发明专利]工业数据标准梳理的方法和系统在审

专利信息
申请号: 202111240655.2 申请日: 2021-10-25
公开(公告)号: CN116028483A 公开(公告)日: 2023-04-28
发明(设计)人: 刘同锋;叶天琦;周明;黄明;腾逸龙 申请(专利权)人: 上海宝信软件股份有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2458
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 胡晶
地址: 200120 上海市浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 工业 数据 标准 梳理 方法 系统
【权利要求书】:

1.一种工业数据标准梳理的方法,其特征在于,包括:

步骤S1:将业务系统的元数据批量采集到数据平台;

步骤S2:分析所述元数据之前的关系;

步骤S3:获取专家指导信息;

步骤S4:根据专家指导信息对所述元数据之间的关系进行修正和丰富,分析得到数据项的热度列表,根据按照热度列表的排序依次得到各个数据项匹配的数据标准和业务术语。

2.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S1中:

步骤S1.1:通过数据平台连接到业务系统,自动批量采集业务系统的元数据;其中,所述元数据包括数据库、数据表、数据项以及关联关系;将元数据按业务系统分类汇聚到数据平台中;

步骤S1.2:针对采集到的元数据,自动对元数据做数据概要分析,其中,所述数据概要分析包括:对于数值型元数据分析出最大值、最小值、平均值、中位值或者数值分布,对于字符型元数据分析出最大长度、最小长度或者数值分布;同时基于规则匹配,分析出邮箱地址、手机号码或者身份证号码,并打上对应的业务标签。

3.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S2中:

步骤S2.1:基于采集到数据平台的元数据,令数据平台自动分析元数据之前的关系;其中,所述元数据之间的关系包括元数据的相似关系和关联关系;

步骤S2.2:根据业务系统数据库中的主外键关系、视图中的表之间的关系,提取出数据表之间、数据项之间的关系作为元数据关联关系;

步骤S2.3:分析数据表名称、数据项名称、数据表描述、数据项描述,分析出数据表之间的相似关系、数据项之间的相似关系作为元数据相似关系;

步骤S2.4:基于数据概要分析得到的数据项之间的关联关系。

4.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S3中:

步骤S3.1:从数据平台获取专家指导信息,其中,所述专家指导信息用于指示修正不准确的元数据之间的关系;

步骤S3.2:从数据平台获取手动增加信息,其中,所述手动增加信息用于指示对元数据之间的关系进行补充。

5.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S4中:

步骤S4.1:数据平台根据自动采集的元数据、分析得到的相似关系和关联关系、专家指导信息、手动增加信息,自动分析得到数据项的热度列表,其中,所述热度列表包括数据项的引用广度、数据项的引用深度;

步骤S4.2:数据平台按热度列表排序自动拆解并智能匹配数据平台中已有的数据标准、业务术语,匹配依据一是基于自然语言处理技术根据数据项的名称和描述,匹配数据标准、业务术语的名称和描述,匹配依据二是基于数据项的概要分析结果,匹配相同数据类型、相同值域的数据标准;

步骤S4.3:数据平台展示出匹配上的数据标准和业务术语。

6.一种工业数据标准梳理的系统,其特征在于,包括:

模块M1:将业务系统的元数据批量采集到数据平台;

模块M2:分析所述元数据之前的关系;

模块M3:获取专家指导信息;

模块M4:根据专家指导信息对所述元数据之间的关系进行修正和丰富,分析得到数据项的热度列表,根据按照热度列表的排序依次得到各个数据项匹配的数据标准和业务术语。

7.根据权利要求6所述的工业数据标准梳理的系统,其特征在于,在所述模块M1中:

模块M1.1:通过数据平台连接到业务系统,自动批量采集业务系统的元数据;其中,所述元数据包括数据库、数据表、数据项以及关联关系;将元数据按业务系统分类汇聚到数据平台中;

模块M1.2:针对采集到的元数据,自动对元数据做数据概要分析,其中,所述数据概要分析包括:对于数值型元数据分析出最大值、最小值、平均值、中位值或者数值分布,对于字符型元数据分析出最大长度、最小长度或者数值分布;同时基于规则匹配,分析出邮箱地址、手机号码或者身份证号码,并打上对应的业务标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝信软件股份有限公司,未经上海宝信软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111240655.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top