[发明专利]一种基于群智汇聚收敛的资源关联方法有效
申请号: | 201710798035.8 | 申请日: | 2017-09-06 |
公开(公告)号: | CN107609084B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 杜旭;杨宗凯;李浩;徐帅 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/26 |
代理公司: | 武汉凌达知识产权事务所(特殊普通合伙) 42221 | 代理人: | 刘念涛 |
地址: | 430079 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 汇聚 收敛 资源 关联 方法 | ||
1.一种基于群智汇聚收敛的资源关联方法,其特征在于,包括如下步骤
S1,制定面向大众参与的学习资源标注任务,调动参与者为学习资源的相关度做标记;
S11,设置学习资源间相关性的区间为(0,1),资源间的相关性越强则越接近1,反之接近0;
S12,设置学习资源间的标注方式;
S2,招募参与者,剔除恶意用户;
S21,制定参与者的参与规则,招募一部分用来完成标注任务的参与者形成参与者池,从参与者池中选取一部分用户作为活跃用户,给予活跃用户标注权限并发送标注任务,未选中的作为非活跃用户用于候补;
S22,通过评估参与者的任务完成情况,根据标注结果筛选出欺骗类型的参与者,标记为不合格用户,所述欺骗类型的参与者是采取应付的心态进行标注而且所提交的结果质量较差的用户;
S23,从上述参与者池中选择相同数量的非活跃用户替换不合格用户;
S3,在过滤掉不合格用户后,收集合格用户的标注结果,利用参与者所做的标记分类,使用EM算法不断迭代,计算出每个参与者误差率和相关性
S31,设置相关性
,即采用大多数原则,其中是参与者对评估任务
S32,对多个参与者标记的结果进行极大似然估计,得到
S33,利用贝叶斯公式和估计出的误差率,计算相关性
其中p表示随机挑选出真实相关性是j的相关性评估任务的概率;
任务的所有关联权重类别集合用J(j=1,2…J)p(data)表示:参与者标记的结果数据中,任务i真实关联权重为j的概率;p(data|Tij=1)表示在任务i中关联权重j即为该任务的真实权重条件下,任务i真实关联权重为j的概率;p(Tij=1)表示:任务i中关联权重j即为该任务的真实权重;
S34,重复上述步骤直到相关性
S4,收集参与者的标注结果集,计算资源间的关联度;
S41,针对用户每个标注任务会生成对应的包含有任务信息、学习资源信息、标注信息、标注准确率和资源关联度的关联记录,多条关联记录形成关联数据库;
S42,将关联数据存储到服务器。
2.根据权利要求1所述的一种基于群智汇聚收敛的资源关联方法,其特征在于,所述步骤S12的标注方式是一种直接填充知识与知识的相关性,本质是描述资源A、资源B和二者关联关系的三元组A,*,B。
3.根据权利要求1所述的一种基于群智汇聚收敛的资源关联方法,其特征在于,所述步骤S2中筛选欺骗类型参与者采用动态可控的方式,针对不同的任务类型采用不同的检测点设置方式;替换规则可随机选取参与者,统一选取参与者,或者根据以往情况选择信誉度好工作认真的参与者,或者采用前述三种方式联合应用的方式。
4.根据权利要求3所述的一种基于群智汇聚收敛的资源关联方法,其特征在于,所述的随机选取参与者是利用相关性的特征距离来计算每个参与者w的随机分数,假设w为所有参与者的集合,T为所有参与者需要进行知识点相关性判断的集合,Jj,w表示参与者w对知识点j所做的相关性标记,Jj,w表示其他参与者对j所做的相关性标记集合,disij表示对于相同的知识点集合参与者w和其他参与者i之间在上述所做判断的差异距离,则参与者w与所有其他参与者在所有知识点判断上的差异距离计算公式如下:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710798035.8/1.html,转载请声明来源钻瓜专利网。