[发明专利]基于熵的数据价值衡量与定价方法在审
申请号: | 201611132337.3 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106815743A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 姚建国;李希君;管海兵 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 价值 衡量 定价 方法 | ||
技术领域
本发明涉及信息服务技术领域,具体地,涉及基于熵的数据价值衡量与定价方法。
背景技术
近年来,信息商品的交易和无线网络的使用正在经历一个巨大的增长。人们对于高质量,可信赖的信息商品的需求与日俱增。信息商品的交易量逐年递增,此类交易服务多数由各大数据提供平台(诸如Microsoft Azure Data Marketplace,Inforchimp等)所提供。这些数据提供平台不仅出售数据和信息商品,同时还搭配出售与数据相关的分析和存储服务。但是,至今在这些平台上,仍然没有一个统一的、明确的信息商品定价策略,这阻碍了信息商品交易的进一步发展。如今,主流的或者被广泛研究的定价策略有三种:
订阅制(Subscription)策略:
订阅制是一种传统的信息商品定价策略。在那些使用该策略的数据交易平台,如Microsoft Azure Data Marketplace,数据购买者并不会真正拥有数据,而是每月缴纳一定的费用,从而获得访问该数据平台上相应数据的权利。比如在Azure平台,数据商品分为两大类:无限制订阅型和有限制订阅型。无限制订阅型数据商品是指用户在每月缴纳一定费用后,可以无限制次数地访问该数据商品。而有限制订阅型数据商品是指用户在每月缴纳一定费用后,只能有限次数地访问该数据商品。缴费是月结制,即每月用完访问次数或者使用时间已到,就只能到下个月重新缴费再获得数据访问权。虽然,对于数据交易平台来说,这种定价策略易于实现,但是如果没有设计好商品价格水平的话,会容易出现套利现象,从而导致平台利益受损。
基于查询(Query)的定价策略:
基于查询的定价策略是收到SQL关系数据库的启发。其交易流程是数据购买者对于自己想要的数据商品,向数据交易平台发起一个查询(Query)。数据交易平台根据该查询将指定数据集的视窗(View)作为结果返回给购买者。其交易费用是由交易平台根据查询复杂度而制定。然而,比较难的是找到一个精确度量查询复杂度的函数,从而比较难制定出交易费用。
捆绑以及区别定价(Bundling and Discrimination)策略:
捆绑定价策略是来自于资本数据交易市场。在资本数据交易市场,数据提供者常常将多种信息商品捆绑在一起,并对不同层次的消费者收取不同的费用。因此,这种定价策略就会产生价格歧视效应。这种定价策略只有在捆绑销售中单个商品之间是呈负相关关系时才会有效,不同的购买者才会愿意以不同的价格购买该捆绑商品。但是如今大多数信息商品都是非文本的数值数据(离散型的或者连续型的),人们不容易直观地发现这些数据间的相关程度。另外,如今也没有一个量化的方法来度量数据商品中的信息量。因此,数据生产商们也很难对自己的数据商品进行一个合理定价,因此更无法有效地捆绑出售自己的产品。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于熵的数据价值衡量与定价方法。
根据本发明提供的基于熵的数据价值衡量与定价方法,包括如下步骤:
步骤1:定义数据商品新型的价格函数;
步骤2:将数据集抽象成为数据矩阵;
步骤3:从数据集的行和属性两个角度来度量数据集的信息量,获得数据集的定价策略。
优选地,所述步骤1包括:令数据的价格P是数据信息熵H的函数,记为:
P=f(H)(1)
将一个拥有n个可能的值,记为{x1,x2,…,xn}和概率分布函数为p(X)的离散变量X的熵定义为H(X):
式中:p(xi)表示取xi值时的概率;当存在两个离散变量X,Y,且分别对应有n和m个可能的输出值,记为{x1,x2,…,xn},{y1,y2,…,ym},则定义X,Y的联合概率分布函数p(X,Y),采用联合熵来度量X,Y所共同拥有的信息量,定义为H(X,Y):
式中:p(xi,yj)表示输出值xi,yj同时出现的联合概率;n和m为正整数。
优选地,所述步骤2包括:
步骤2.1:将拥有n行记录m列属性的数据集抽象成为一个n×m的数据矩阵X,记为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611132337.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置