[发明专利]数据资产生成方法、装置、电子设备在审
申请号: | 202110020007.X | 申请日: | 2021-01-07 |
公开(公告)号: | CN112700157A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 自建华;张延松 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10;G06F16/22 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 资产 生成 方法 装置 电子设备 | ||
公开一种数据资产生成方法、装置、电子设备及机器可读存储介质。在本申请中,从对接的数据治理平台获取数据治理后的数据表的表信息和与数据表对应的数据异常信息;基于数据异常信息和表信息,计算得到数据表的表质量信息;当表质量信息达到预设阈值时,向用户输出数据表,以使用户确定数据表是否为数据资产。一方面,将数据表确定为数据资产的过程流程化,提高了数据资产生成及管理效率。另一方面,通过计算数据表的表质量,并将符合目标质量标准的数据表生成为数据资产,提高了对数据资产的数据质量的管控。
技术领域
本申请一个或多个实施例涉及计算机应用技术领域,尤其涉及数据资产生成方法、装置、电子设备及机器可读存储介质。
背景技术
在企业向数字化转型的过程中,将数据作为资产进行管理已经成为共识。如今,各企业都依赖于自身拥有的数据资产以做出更明智和有效的决策,利用数据资产管理,提供更好的产品和服务,降低成本及风险控制。然而,由于数据往往错综复杂并且基于数据生成数据资产的效率较为低下,所以如何将数据快速高效地转化为对应的可信数据资产并进行有效管控,对提高数据资产的使用价值就显得尤为重要。
发明内容
本申请提供一种数据资产生成方法,应用于数据资产管理平台,所述方法包括:
从对接的数据治理平台获取数据治理后的数据表的表信息和与所述数据表对应的数据异常信息;
基于所述数据异常信息和所述表信息,计算得到所述数据表的表质量信息;
当所述表质量信息达到预设阈值时,向用户输出所述数据表,以使用户确定所述数据表是否为数据资产。
可选的,所述表信息至少包括表名、表结构、表数据行数;所述数据异常信息至少包括数据异常治理规则类型、与数据异常治理规则类型对应的异常数据行数和异常字段数;
所述基于所述数据异常信息和所述表信息,计算得到所述数据表的表质量信息,包括:
基于与所述表名对应的所述表结构、所述表数据行数、所述异常数据行数和所述异常字段数,计算得到与各个数据异常治理规则类型分别对应的质量评分;
基于与各个数据异常治理规则类型分别对应的预设权重系数和计算得到的质量评分进行加权计算得到最终总分,将得到的最终总分确定为所述数据表的表质量信息。
可选的,所述基于与所述表名对应的所述表结构、所述表数据行数、所述异常数据行数和所述异常字段数,计算得到与各个数据异常治理规则类型分别对应的质量评分,包括:
将所述异常数据行数和所述异常字段数的乘积,除以所述表数据行数与所述表结构的总字段数的乘积得到的商,按预设的百分制计算方法进行分值计算得到百分制得分;
将得到的百分制得分,确定为与各个数据异常治理规则类型分别对应的质量评分。
可选的,各个数据异常治理规则类型分别包括若干子规则类型;所述若干子规则类型分别对应异常数据行数和异常字段数;
所述基于与所述表名对应的所述表结构、所述表数据行数、所述异常数据行数和所述异常字段数,计算得到与各个数据异常治理规则类型分别对应的质量评分,包括:
将若干子规则类型分别对应的异常数据行数和异常字段数,按各个数据异常治理规则类型进行汇总,得汇总后的与各个数据异常治理规则类型分别对应的异常数据个数;
基于与所述表名对应的所述表结构、所述表数据行数、汇总后的所述异常数据个数,计算得到与各个数据异常治理规则类型分别对应的质量评分。
可选的,还包括:
响应于用户触发的将所述数据表确定为数据资产的操作指令,将所述数据表作为数据资产保存在本地的数据库中。
可选的,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110020007.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置