[发明专利]一种众包场景中针对数值任务获取高质量数据的方法在审
申请号: | 202110727017.7 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113379392A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 李向阳;史专;张兰 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q10/06 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;付久春 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 场景 针对 数值 任务 获取 质量 数据 方法 | ||
本发明公开了一种众包场景中针对数值任务获取高质量数据的方法,包括:步骤1,建立用户的初始主题级可靠性:确定包括样本数值任务和目标数值任务的数值任务集中每个数值任务的潜在主题,步骤2,依据用户的初始主题级可靠性进行真值推断;步骤3,通过激励机制进行在线任务分配:根据任务需求方提供的答案范围和精度要求,对任务的连续数值答案进行离散化得到离散化后的候选答案和离散化后的回答集;根据用户的主题级可靠性和针对任务的回答建立任务的分布矩阵,并依据分布矩阵计算任务的真值分布;当需要给到达的某一用户分配任务时,选取不确定性减少量最多的任务分配给该用户。能提高众包任务结果的质量。
技术领域
本发明涉及众包获取数据的领域,尤其涉及一种收集数据的众包场景中针对数值任务获取高质量数据的方法。
背景技术
随着传感器技术和无线通信技术日新月异的发展,各类智能移动终端已经逐步发展为人们日常生活中的主流计算和通信设备。这些快速普及的移动设备,结合日益完善的Android、iOS等移动操作系统以及3G/4G/5G通信技术的发展,共同为众包这一快速、成本低廉的数据收集方式的兴起提供了基础。
目前,众包场景中通过激励机制获取高质量数据已有一系列方法,但这些方法主要针对的是分类任务,并不适用于数值任务。在分类任务(Categorical tasks)中,现有方法通常使用用户概率模型、混淆矩阵模型以及潜在领域模型来评估用户回答的可靠程度,并在此可靠性基础上通过相应的真值推断的算法和基于激励机制的在线任务分配算法,但现有方法都不能直接用于数值任务中,主要因为:1)现有的这些可靠性模型是为分类任务而设计的,是依据用户回答的准确性来建模的,而在数值任务中,需要依据用户回答的误差来对用户可靠性建模;2)现有的工作没有考虑到数值任务存在一些潜在的聚类,用户在不同任务类别上具有不同的可靠性。
发明内容
针对现有技术所存在的问题,本发明的目的是提供一种众包场景中针对数值任务获取高质量数据的方法,能解决现有收集数据的众包场景中,获取高质量数据的方法都是针对分类任务的,但由于分类任务与数值任务存在建模依据不同以及的数值任务存在一些潜在聚类的区别,使得现有的方法存在并不能适用于数值任务的问题。
本发明的目的是通过以下技术方案实现的:
本发明实施方式提供一种众包场景中针对数值任务获取高质量数据的方法,包括:
步骤1,建立用户的初始可靠性:确定数值任务集中每个数值任务的潜在主题,其中,所述数值任务集中的数值任务包括已知答案的样本数值任务和待回答的目标数值任务;
根据用户对样本数值任务的回答集和真值,初始化所述用户对样本数值任务的潜在主题的主题级可靠性,得到所述用户的初始主题级可靠性;
步骤2,依据用户的初始主题级可靠性进行真值推断:根据所述用户的初始主题级可靠性和每个目标数值任务的回答集推断得出每个目标数值任务的真值和主题分布,根据推断得出的每个目标数值任务的真值、主题分布和每个目标数值任务的回答集,迭代更新得出用户的主题级可靠性;
步骤3,通过激励机制进行在线任务分配:
根据任务需求方提供的答案范围和精度要求,对所述任务需求方给出的目标数值任务的连续数值答案进行离散化得到离散化后的候选答案和离散化后的回答集,用离散化后的候选答案和离散化后的回答集建立目标数值任务的分布矩阵;
根据所建立的目标数值任务的分布矩阵和用户的主题级可靠性计算目标数值任务的真值分布;
当需要给到达的某一用户分配目标数值任务时,通过熵衡量目标数值任务真值分布的不确定性,并根据该用户对目标数值任务可能的回答,计算出当目标数值任务分配给该用户时的不确定性,选取单位报价内不确定性减少量最多的目标数值任务分配给该用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110727017.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种螺帽自动组装机构
- 下一篇:一种功率放大器及通信设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理