[发明专利]众包场景中对于数值任务的真值推断和在线任务分配方法在审
申请号: | 202011426146.4 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112416560A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 张兰;李向阳;史专 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 对于 数值 任务 真值 推断 在线 分配 方法 | ||
1.一种众包场景中对于数值任务的真值推断和在线任务分配方法,其特征在于,包括:
构建数值任务集中每个数值任务的潜在主题,其中,所述数值任务集中包括已知答案的样本数值任务和待回答的目标数值任务;
根据用户对于所述样本数值任务的回答集和所述样本数值任务的真值,初始化所述用户对于所述样本数值任务的潜在主题的主题级可靠性,得到所述用户的初始化主题级可靠性;
根据所述用户的初始化主题级可靠性以及用户对于所述目标数值任务的回答集推断出每个所述目标数值任务的真值和主题分布;
根据每个所述目标数值任务的真值和主题分布,以及所述用户对于所述目标数值任务的回答集,迭代更新所述用户的主题级可靠性;
根据迭代更新后得到的用户的主题级可靠性和所述目标数值任务的分布矩阵在线分配新的数值任务。
2.如权利要求1所述的方法,其特征在于,
所述根据用户对于所述样本数值任务的回答集和所述样本数值任务的真值,初始化所述用户对于所述样本数值任务的潜在主题的主题级可靠性,得到所述用户的初始化主题级可靠性包括:
通过高斯分布为所述用户对样本数值任务回答的误差和所述用户的初始化主题级可靠性建模,得到概率图模型;
基于所述概率图模型,通过Gibbs-EM算法计算样本数值任务对所述各潜在主题的隶属度并优化样本数值任务主题的先验参数,同时计算得到用户初始化主题级可靠性;以及/或者
所述迭代更新所述用户的主题级可靠性包括:
通过推断出的所述目标数值任务的真值和用户对于所述目标数值任务的回答集得到用户对于目标数值任务的回答误差;
通过所述回答误差结合概率图模型,对当前用户的主题级可靠性的先验参数进行迭代更新。
3.如权利要求1所述的方法,其特征在于,所述根据所述用户的初始化主题级可靠性以及用户对于所述目标数值任务的回答集推断出每个所述目标数值任务的真值和主题分布包括:
对于所述目标数值任务当前参数下的真值和主题分布的潜在变量分布,计算最大后验概率的对数似然函数的期望;
对所述对数似然函数的期望求导得出所述目标数值任务的真值和主题分布。
4.如权利要求1所述的方法,其特征在于,所述根据迭代更新后得到的用户的主题级可靠性和所述目标数值任务的分布矩阵在线分配新的数值任务包括:
根据任务需求方提供的所述目标数值任务的答案范围和精度要求,对所述目标数值任务的连续数值答案进行离散化;
基于所述离散化的数值并依据所述更新后的用户主题级可靠性和用户对于所述当前目标数值任务的回答建立当前任务的分布矩阵,同时依据所述分布矩阵计算所述目标数值任务的真值分布;
通过熵衡量所述目标数值任务真值分布的不确定性,并根据用户对于所述目标数值任务可能的回答,计算当所述目标数值任务分配给用户时的不确定性;
根据所述目标数值任务真值分布的不确定性和所述目标数值任务分配给用户时的不确定性,通过贪心算法选取目标数值任务真值分布与所述目标数值任务分配给用户时的不确定性的差值最大目标数值任务分配给用户。
5.如权利要求4所述的方法,其特征在于,所述对所述目标数值任务的连续数值答案进行离散化包括:
其中:t表示任务;et,min表示任务t的回答范围的最小值;δt表示任务t的精度要求;ai表示对于任务t的回答集At中任意一个回答。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011426146.4/1.html,转载请声明来源钻瓜专利网。