[发明专利]端到端的数据探查方法、装置、计算机设备和存储介质在审

专利信息
申请号: 202011298500.X 申请日: 2020-11-19
公开(公告)号: CN112434009A 公开(公告)日: 2021-03-02
发明(设计)人: 朱明浩;张霖云;孙超凡;张旭;王龙;陈立力;刘军营;胡立文 申请(专利权)人: 浙江大华技术股份有限公司
主分类号: G06F16/21 分类号: G06F16/21;G06F16/215;G06F16/248;G06F16/2458
代理公司: 杭州华进联浙知识产权代理有限公司 33250 代理人: 范丽霞
地址: 310016 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 端到端 数据 探查 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及一种端到端的数据探查方法、装置、计算机设备和存储介质,该方法容器化部署于计算机设备,包括:基于数据探查指令获取采样数据;确定所述采样数据对应的探查配置信息,所述探查配置信息包括多个数据探查维度;基于多个所述数据探查维度对所述采样数据进行多维度探查分析,得到多维度探查指标;所述多维度探查指标包括:数据量指标、表复杂度指标、表质量指标和表价值指标;根据预设模板将所述多维度探查指标进行可视化显示。通过本申请,能够从多个维度表征业务数据,充分反映业务数据的特点,从而为下一环节的数据评估和利用提供有效的支撑。

技术领域

本申请涉及数据处理技术领域,特别是涉及一种端到端的数据探查方法、装置、计算机设备和存储介质。

背景技术

数据探查是通过对数据集的查询和分析来达到了解数据特征和数据质量的目的,数据探查是数据治理领域的一个重要环节,可以给数据治理的后续步骤提供有力支撑。数据探查能更多、更好地了解数据,发现源数据情况和问题,从而为下一环节的数据评估和利用提供有效的支撑。

现有的数据探查方法主要针对数据整体或表面特征进行探查,通过编写统计代码或者配置规则的方式实现,无法充分反应数据各个维度的指标信息,对数据的分析不够全面,不能够充分理解数据,难以准确反应数据特征。此外,数据探查方法在实际应用时,需要修改配置参数进行适配运行环境,对现场异种环境的系统依赖性大。

发明内容

本申请实施例提供了一种端到端的数据探查方法、装置、计算机设备和存储介质,以至少解决相关技术中数据分析不全面的问题。

第一方面,本申请实施例提供了一种端到端的数据探查方法,所述端到端的数据探查方法容器化部署于计算机设备,包括以下步骤:

基于数据探查指令获取采样数据;

确定所述采样数据对应的探查配置信息,所述探查配置信息包括多个数据探查维度;

基于多个所述数据探查维度对所述采样数据进行多维度探查分析,得到多维度探查指标;所述多维度探查指标包括:数据量指标、表复杂度指标、表质量指标和表价值指标;

根据预设模板将所述多维度探查指标进行可视化显示。

在其中一些实施例中,所述数据探查指令包括:

数据源连接配置、数据预览和数据分析。

在其中一些实施例中,所述数据探查维度包括:数据量维度、表复杂度维度、表质量维度和表价值维度,则

所述数据量指标包括:表记录数和表字段数;

所述表复杂度指标包括:表主题域和表关联关系;

所述表质量指标包括:表要素异常率、码值完整性和业务字段完整性;

所述表价值指标包括:实时性、数据轨迹和数据关联。

在其中一些实施例中,通过以下步骤进行表主题域划分或表要素异常率识别分析:

获取所述采样数据对应的数据表;

将所述数据表中的元数据与标准值进行规则匹配,得到匹配结果;

根据所述匹配结果统计匹配率,以根据所述匹配率进行表主题域划分或表要素异常率识别。

在其中一些实施例中,通过以下步骤进行表主题域划分或表要素异常率识别分析:

获取所述采样数据对应的数据表;

获取所述数据表中的元数据的隐语义信息,以根据所述隐语义信息进行表主题域划分或表要素异常率识别。

在其中一些实施例中,获取所述数据表中的元数据的隐语义信息,以根据所述隐语义信息进行表主题域划分或表要素异常率识别包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011298500.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top