[发明专利]工业数据标准梳理的方法和系统在审
申请号: | 202111240655.2 | 申请日: | 2021-10-25 |
公开(公告)号: | CN116028483A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 刘同锋;叶天琦;周明;黄明;腾逸龙 | 申请(专利权)人: | 上海宝信软件股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工业 数据 标准 梳理 方法 系统 | ||
1.一种工业数据标准梳理的方法,其特征在于,包括:
步骤S1:将业务系统的元数据批量采集到数据平台;
步骤S2:分析所述元数据之前的关系;
步骤S3:获取专家指导信息;
步骤S4:根据专家指导信息对所述元数据之间的关系进行修正和丰富,分析得到数据项的热度列表,根据按照热度列表的排序依次得到各个数据项匹配的数据标准和业务术语。
2.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S1中:
步骤S1.1:通过数据平台连接到业务系统,自动批量采集业务系统的元数据;其中,所述元数据包括数据库、数据表、数据项以及关联关系;将元数据按业务系统分类汇聚到数据平台中;
步骤S1.2:针对采集到的元数据,自动对元数据做数据概要分析,其中,所述数据概要分析包括:对于数值型元数据分析出最大值、最小值、平均值、中位值或者数值分布,对于字符型元数据分析出最大长度、最小长度或者数值分布;同时基于规则匹配,分析出邮箱地址、手机号码或者身份证号码,并打上对应的业务标签。
3.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S2中:
步骤S2.1:基于采集到数据平台的元数据,令数据平台自动分析元数据之前的关系;其中,所述元数据之间的关系包括元数据的相似关系和关联关系;
步骤S2.2:根据业务系统数据库中的主外键关系、视图中的表之间的关系,提取出数据表之间、数据项之间的关系作为元数据关联关系;
步骤S2.3:分析数据表名称、数据项名称、数据表描述、数据项描述,分析出数据表之间的相似关系、数据项之间的相似关系作为元数据相似关系;
步骤S2.4:基于数据概要分析得到的数据项之间的关联关系。
4.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S3中:
步骤S3.1:从数据平台获取专家指导信息,其中,所述专家指导信息用于指示修正不准确的元数据之间的关系;
步骤S3.2:从数据平台获取手动增加信息,其中,所述手动增加信息用于指示对元数据之间的关系进行补充。
5.根据权利要求1所述的工业数据标准梳理的方法,其特征在于,在所述步骤S4中:
步骤S4.1:数据平台根据自动采集的元数据、分析得到的相似关系和关联关系、专家指导信息、手动增加信息,自动分析得到数据项的热度列表,其中,所述热度列表包括数据项的引用广度、数据项的引用深度;
步骤S4.2:数据平台按热度列表排序自动拆解并智能匹配数据平台中已有的数据标准、业务术语,匹配依据一是基于自然语言处理技术根据数据项的名称和描述,匹配数据标准、业务术语的名称和描述,匹配依据二是基于数据项的概要分析结果,匹配相同数据类型、相同值域的数据标准;
步骤S4.3:数据平台展示出匹配上的数据标准和业务术语。
6.一种工业数据标准梳理的系统,其特征在于,包括:
模块M1:将业务系统的元数据批量采集到数据平台;
模块M2:分析所述元数据之前的关系;
模块M3:获取专家指导信息;
模块M4:根据专家指导信息对所述元数据之间的关系进行修正和丰富,分析得到数据项的热度列表,根据按照热度列表的排序依次得到各个数据项匹配的数据标准和业务术语。
7.根据权利要求6所述的工业数据标准梳理的系统,其特征在于,在所述模块M1中:
模块M1.1:通过数据平台连接到业务系统,自动批量采集业务系统的元数据;其中,所述元数据包括数据库、数据表、数据项以及关联关系;将元数据按业务系统分类汇聚到数据平台中;
模块M1.2:针对采集到的元数据,自动对元数据做数据概要分析,其中,所述数据概要分析包括:对于数值型元数据分析出最大值、最小值、平均值、中位值或者数值分布,对于字符型元数据分析出最大长度、最小长度或者数值分布;同时基于规则匹配,分析出邮箱地址、手机号码或者身份证号码,并打上对应的业务标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝信软件股份有限公司,未经上海宝信软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111240655.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置