[发明专利]一种基于数据质量的移动群智感知在线定价方法和系统在审
申请号: | 201910233947.X | 申请日: | 2019-03-26 |
公开(公告)号: | CN109993640A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 江勇;李丽;梁甲琛 | 申请(专利权)人: | 清华大学深圳研究生院 |
主分类号: | G06Q30/08 | 分类号: | G06Q30/08;G06K9/62 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 孟学英 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 感知 马尔可夫决策过程模型 移动 定价 利润最大化 策略发布 动作选择 连续型 构建 算法 耗尽 标价 奖励 预算 发布 | ||
本发明提供一种基于数据质量的移动群智感知在线定价方法和系统,方法包括:获取移动群智感知任务;对所述移动群智感知任务构建马尔可夫决策过程模型,从所述马尔可夫决策过程模型中选择所述移动群智感知任务的初始价格并发布;根据基于连续型Actor‑Critic算法的策略发布所述移动群智感知任务的质量要求;获取用户的数据质量、用户的动作选择,根据所述马尔可夫决策过程模型计算招募用户所得到的奖励并确定招募结果;根据所述招募结果和所述马尔可夫决策过程模型,将标价转移到下一个价格并等待下一个用户到来直到耗尽预算或无更多的用户到来。在招募合适的感知任务参与者并尽可能提高数据质量以实现平台利润最大化。
技术领域
本发明涉及移动群智感知技术领域,尤其涉及一种基于数据质量的移动群智感知在线定价方法和系统。
背景技术
近年来,移动群智感知为大规模感知任务提供了新的形式。移动终端处理器、内存等硬件设备的快速发展和提升,移动设备领域得到了繁荣发展,摄像头、麦克风、GPS、陀螺仪、加速度计等传感器嵌入到以智能手机、平板电脑为代表的智能移动终端中,提供了高效的收集数据的方式。因此,出现了许多移动群智感知应用,例如Amazon Mechanical Turk作为一个在线众包平台, VTrack则通过群智感知的方式提供交通信息以及Sensorly则用来构建蜂窝网 /WiFi网络的覆盖地图。
在实际应用中,一个经典的移动群智感知系统通常包括三部分。第一部分是数据需求者,他们将需要完成的感知任务及相应的预算提交给平台;第二部分是一组移动设备用户,他们利用移动设备完成感知任务数据的收集并获得相应的回报;第三部分是平台,作为中介,接收数据需求者的任务请求,选择合适的用户完成相应的任务,支付相应的报酬,最终将收集到的数据返回给数据需求者。
平台通过将用户收集到的数据出售给数据需求者来获得利润。然而,用户通过消耗自己的计算、人力等资源来参与感知任务,同时,一些任务要求用户提交一些敏感信息,这影响到了用户的隐私。因此,如何激励用户参与群智感知任务是一个重要的问题。移动群智感知系统中的数据质量问题,由于用户设备以及完成任务的熟练度的不同,采集到的数据质量会有很大的差异。高质量的数据将带来更高的价值,但是通常用户需要更高的成本,因此,设计一个好的激励机制来招募合适的用户完成相应的感知任务是非常有意义的。
目前常见的激励用户的方法大多基于拍卖机制,大多数激励机制针对于离线场景,即平台等待足够多的用户到达后采用逆向拍卖的模式来选择合适的用户参与感知任务。然而在实际中,用户总是随机来到平台,观察过相关任务要求及相应回报后,立即选择是否参加该任务。有部分激励机制考虑到了在线场景,但大多对任务类型作出了过多假设或者假设平台对用户的成本或其分布是已知的。此外,数据质量也同样是移动群智感知系统中一个重要的因素。因此,如何设计一个在线环境下基于数据质量且未知用户成本信息的移动群智感知激励机制是一个非常具有挑战的问题。
发明内容
本发明为了解决现有技术中缺乏一种在线环境下基于数据质量且未知用户成本信息移动群智感知激励机制问题,提供一种基于数据质量的移动群智感知在线定价方法和系统。
为了解决上述问题,本发明采用的技术方案如下所述:
一种基于数据质量的移动群智感知在线定价方法,包括如下步骤:S1:获取移动群智感知任务,所述移动群智感知任务包括:任务内容,任务预算,质量要求;S2:对所述移动群智感知任务构建马尔可夫决策过程模型,从所述马尔可夫决策过程模型中选择所述移动群智感知任务的初始价格并发布;S3:根据基于连续型Actor-Critic算法的策略发布所述移动群智感知任务的质量要求; S4:获取用户的数据质量、用户的动作选择,根据所述马尔可夫决策过程模型计算招募用户所得到的奖励并确定招募结果;若奖励大于零,则表示成功招募所述用户,支付价格给所述用户;若奖励小于零,则表示未成功招募所述用户; S5:根据所述招募结果和所述马尔可夫决策过程模型,将标价转移到下一个价格并等待下一个用户到来直到耗尽预算或无更多的用户到来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233947.X/2.html,转载请声明来源钻瓜专利网。