[发明专利]一种数据价值评估平台和方法在审
申请号: | 201810510595.3 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108734405A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 王肃;庞钰宁;吴燕飞;李彩虹 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估数据 预设 表征数据 价值评估 质量指标 价值指标 业务应用 运算关系 申请 | ||
1.一种数据价值评估平台,其特征在于,该平台包括:
指标值确定模块,用于为待评估数据确定预设指标的指标值;
其中,所述预设指标包括表征数据质量的数据质量指标和表征数据业务应用价值的业务价值指标;
成本价值确定模块,用于根据所述待评估数据的成本为所述待评估数据确定成本价值;
数据价值确定模块,用于基于确定的指标值和成本价值之间的预设运算关系,确定所述待评估数据的数据价值。
2.如权利要求1所述的平台,其特征在于,所述数据质量指标包括数据一致性指标;
所述指标值确定模块,具体用于确定所述待评估数据所包含数据内容与所述待评估数据对应描述信息的一致性程度;并基于所述一致性程度确定所述待评估数据的数据一致性指标的指标值,且所述一致性程度越高,表征所述待评估数据的数据一致性指标的指标值越高。
3.如权利要求2所述的平台,其特征在于,所述指标值确定模块,具体用于确定如下一项或多项数据内容与对应描述信息之间的一致性程度,且任一项数据内容与对应描述信息之间的一致性程度越高表征所述待评估数据的数据一致性指标的指标值越高:
所述待评估数据包含的数据量与所述待评估数据的描述信息所描述的数据量;
所述待评估数据的大小与所述待评估数据的描述信息所描述的大小;
所述待评估数据的数据格式与所述待评估数据的描述信息所描述的数据格式。
4.如权利要求1所述的平台,其特征在于,所述数据质量指标包括如下指标的一种或多种:数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标;
针对包括数据完整性指标的情况,所述指标值确定模块,具体用于确定所述待评估数据所包含数据条目中的空值占比;并基于所述空值占比确定所述待评估数据的数据完整性指标的指标值,且所述空值占比越低,表征所述待评估数据的数据完整性越高。
针对包括数据冗余度指标的情况,所述指标值确定模块,具体用于确定所述待评估数据所包含的数据条目中重复条目的占比;并基于所述重复条目的占比确定所述待评估数据的数据冗余度指标的指标值,且所述重复条目的占比越低,表征所述待评估数据的数据冗余度越低。
针对包括数据时效性指标的情况,所述指标值确定模块,具体用于确定所述待评估数据产生时间所跨越的时间区间,以及所述待评估数据产生时间与所述待评估数据提供时间之间的时间差;基于所述时间区间和所述时间差确定所述待评估数据的数据时效性指标的指标值:其中,所述时间区间跨度越大,表征所述待评估数据的数据时效性指标的指标值越高;以及所述时间差越小,表征所述待评估数据的数据时效性指标的指标值越高;
针对包括数据量指标的情况,所述指标值确定模块,具体用于确定所述待评估数据包含的数据量;并基于所述数据量确定所述待评估数据的数据量指标的指标值,且所述数据量越大,表征所述待评估数据的数据量指标的指标值越高。
5.如权利要求1所述的平台,其特征在于,还包括:数据爬取模块和相似数据确定模块;
所述数据爬取模块,用于从所述预设平台爬取多个数据集;
所述相似数据确定模块,用于分别对所述待评估数据及所述多个数据集进行解析,确定出所述待评估数据及各数据集的词汇特征;将所述待评估数据的词汇特征分别与各数据集的词汇特征进行文本相似度匹配;将文本相似度达到预设相似度阈值的数据集确定为所述待评估数据的相似数据。
6.如权利要求5所述的平台,其特征在于,所述数据质量指标包括数据稀缺性指标;
所述指标值确定模块,具体用于确定所述待评估数据以及与所述待评估数据相似的相似数据在预设平台的出现次数;并基于所述出现次数确定所述待评估数据的数据稀缺性指标的指标值,且所述出现次数越少,表征所述待评估数据的稀缺性越高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810510595.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理