[发明专利]数据资产生成方法、装置、电子设备在审
申请号: | 202110020007.X | 申请日: | 2021-01-07 |
公开(公告)号: | CN112700157A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 自建华;张延松 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10;G06F16/22 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 资产 生成 方法 装置 电子设备 | ||
1.一种数据资产生成方法,应用于数据资产管理平台,所述方法包括:
从对接的数据治理平台获取数据治理后的数据表的表信息和与所述数据表对应的数据异常信息;
基于所述数据异常信息和所述表信息,计算得到所述数据表的表质量信息;
当所述表质量信息达到预设阈值时,向用户输出所述数据表,以使用户确定所述数据表是否为数据资产。
2.根据权利要求1所述的方法,所述表信息至少包括表名、表结构、表数据行数;所述数据异常信息至少包括数据异常治理规则类型、与数据异常治理规则类型对应的异常数据行数和异常字段数;
所述基于所述数据异常信息和所述表信息,计算得到所述数据表的表质量信息,包括:
基于与所述表名对应的所述表结构、所述表数据行数、所述异常数据行数和所述异常字段数,计算得到与各个数据异常治理规则类型分别对应的质量评分;
基于与各个数据异常治理规则类型分别对应的预设权重系数和计算得到的质量评分进行加权计算得到最终总分,将得到的最终总分确定为所述数据表的表质量信息。
3.根据权利要求2所述的方法,所述基于与所述表名对应的所述表结构、所述表数据行数、所述异常数据行数和所述异常字段数,计算得到与各个数据异常治理规则类型分别对应的质量评分,包括:
将所述异常数据行数和所述异常字段数的乘积,除以所述表数据行数与所述表结构的总字段数的乘积得到的商,按预设的百分制计算方法进行分值计算得到百分制得分;
将得到的百分制得分,确定为与各个数据异常治理规则类型分别对应的质量评分。
4.根据权利要求2所述的方法,各个数据异常治理规则类型分别包括若干子规则类型;所述若干子规则类型分别对应异常数据行数和异常字段数;
所述基于与所述表名对应的所述表结构、所述表数据行数、所述异常数据行数和所述异常字段数,计算得到与各个数据异常治理规则类型分别对应的质量评分,包括:
将若干子规则类型分别对应的异常数据行数和异常字段数,按各个数据异常治理规则类型进行汇总,得汇总后的与各个数据异常治理规则类型分别对应的异常数据个数;
基于与所述表名对应的所述表结构、所述表数据行数、汇总后的所述异常数据个数,计算得到与各个数据异常治理规则类型分别对应的质量评分。
5.根据权利要求1所述的方法,还包括:
响应于用户触发的将所述数据表确定为数据资产的操作指令,将所述数据表作为数据资产保存在本地的数据库中。
6.根据权利要求1所述的方法,还包括:
响应于用户触发的驳回所述数据表作为数据资产的操作指令且所述数据表的表质量信息未达到预设阈值时,将所述数据表返回至数据治理平台,以使数据治理平台重新进行数据治理。
7.根据权利要求1所述的方法,还包括:
响应于用户触发的驳回所述数据表作为数据资产的操作指令且所述数据表的表信息不完整时,向用户输出所述数据表,以使用户补录所述数据表的表信息。
8.一种数据资产生成装置,应用于数据资产管理平台,所述装置包括:
获取模块,从对接的数据治理平台获取数据治理后的数据表的表信息和与所述数据表对应的数据异常信息;
计算模块,基于所述数据异常信息和所述表信息,计算得到所述数据表的表质量信息;
输出模块,当所述表质量信息达到预设阈值时,向用户输出所述数据表,以使用户确定所述数据表是否为数据资产。
9.一种电子设备,包括通信接口、处理器、存储器和总线,所述通信接口、所述处理器和所述存储器之间通过总线相互连接;
所述存储器中存储机器可读指令,所述处理器通过调用所述机器可读指令,执行如权利要求1至7任一项所述的方法。
10.一种机器可读存储介质,所述机器可读存储介质存储有机器可读指令,所述机器可读指令在被处理器调用和执行时,实现权利要求1至7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110020007.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置