[发明专利]一种数据价值评估系统及方法在审
申请号: | 201810834249.0 | 申请日: | 2018-07-26 |
公开(公告)号: | CN110766429A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 李然辉;吴燕飞;阮亚芬;夏珺峥 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 11371 北京超凡志成知识产权代理事务所(普通合伙) | 代理人: | 吴迪 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 价值评估 数据集 重置 价值评估系统 数据获取模块 数据包含 准确评估 综合考虑 申请 收益 | ||
1.一种数据价值评估系统,其特征在于,包括:
数据获取模块,用于获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;
价值评估模块,用于根据该至少一个数据集的重置成本和数据价值影响值,确定所述数据的价值评估值。
2.根据权利要求1所述的系统,其特征在于,所述数据获取模块包括重置成本获取单元;
所述重置成本获取单元用于:
针对所述至少一个数据集中的每个数据集,获取生成该数据集的直接成本、间接成本以及其他成本;
基于获取的所述直接成本、所述间接成本以及所述其他成本,确定该数据集的重置成本。
3.根据权利要求1所述的系统,其特征在于,所述数据价值影响值包括数据一致性影响值,所述数据获取模块包括数据一致性确定单元;所述数据一致性确定单元包括:
数据一致性获取子单元,用于针对所述至少一个数据集中的每个数据集,获取该数据集所包含的数据内容和该数据集对应的描述信息;
数据一致性确定子单元,用于确定所述数据内容与所述描述信息中对应描述的一致性程度;并基于所述一致性程度确定该数据集的数据一致性影响值,且所述一致性程度越高,该数据集的数据一致性影响值越高。
4.根据权利要求3所述的系统,其特征在于,所述数据一致性获取子单元,具体用于针对每个数据集,确定该数据集对应数据文件的第一数据文件大小、以及该数据集对应的描述信息中描述的该数据集对应数据文件的第二数据文件大小;和/或,该数据集的第一数据量大小、以及所述描述信息中描述的该数据集对应的第二数据量大小;和/或,该数据集所包含数据的第一数据类型、以及所述描述信息中描述的该数据集的第二数据类型;
数据一致性确定子单元,具体用于基于如下一种或多种一致性确定该数据集的数据一致性影响值:
所述第一数据文件大小和所述第二数据文件大小之间的一致性;
所述第一数据量大小和所述第二数据量大小之间的一致性;
所述第一数据类型和所述第二数据类型之间的一致性;
且满足:上述任一种一致性越高,该数据集的数据一致性影响值越高。
5.根据权利要求1所述的系统,其特征在于,所述数据价值影响值包括数据完整性影响值,所述数据获取模块包括数据完整性确定单元;所述数据完整性确定单元包括:
数据项统计子单元,用于针对所述至少一个数据集中的每个数据集,统计该数据集中非空的数据项的个数;
数据完整性确定子单元,用于基于统计的数据项的非空占比,确定该数据集的数据完整性影响值,并且满足:所述非空占比越高,该数据集的数据完整性影响值越高。
6.根据权利要求1所述的系统,其特征在于,所述数据价值影响值包括数据冗余度影响值,所述数据获取模块包括数据冗余度确定单元;所述数据冗余度确定单元包括:
数据条目统计子单元,用于针对所述至少一个数据集中的每个数据集,统计该数据集数据条目中的重复条目数;
数据冗余度确定子单元,用于基于该数据集所包含的重复条目占比,确定该数据集的数据冗余度影响值,并且满足:统计的重复条目越少,该数据集的数据冗余度影响值越高。
7.根据权利要求1所述的系统,其特征在于,所述数据价值影响值包括数据时效性影响值,所述数据获取模块包括数据时效性确定单元;所述数据时效性确定单元包括:
数据时间确定子单元,用于针对所述至少一个数据集中的每个数据集,确定该数据集的终止记录时间、起始记录时间和当前评估时间;
数据时效性确定子单元,用于基于确定的所述终止记录时间和所述起始记录时间之间所跨越的时间区间,以及所述起始记录时间和所述当前评估时间之间的时间差,确定该数据集的数据时效性影响值,并且满足:所述时间区间跨度越大,该数据集的数据时效性影响值越高;以及所述时间差越小,该数据集的数据时效性影响值越高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810834249.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据价值评估系统以及方法
- 下一篇:基于机器学习算法的资源分配方法