[发明专利]众包知识验证环境下众包工人可靠性模型建立方法及装置有效
申请号: | 202010179259.2 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111444332B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 李默涵;周琥晨;田志宏;殷丽华;顾钊铨;韩伟红;李树栋;仇晶;唐可可;孙彦斌 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/36 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;麦小婵 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 验证 环境 下众包 工人 可靠性 模型 建立 方法 装置 | ||
本发明公开了众包知识验证环境下众包工人可靠性模型建立方法及装置。所述方法包括:根据预存策略,对众包用户匹配知识领域集,并向众包用户分配知识领域集中的知识,使众包用户验证知识,得到知识标签;基于强化学习算法建立众包工人可靠性模型,并通过众包工人可靠性模型计算知识标签的奖励值,以根据奖励值更新预存策略;重复执行上述操作直至预存策略的更新次数达到预设次数,根据最新的预存策略对众包用户进行资格筛选;在知识验证完成后,将验证正确的知识加入对应的知识图谱。本发明能够基于强化学习,在众包验证环境下建立众包工人可靠性模型,实现对众包工人进行资格筛选,从而提高众包知识验证的效率。
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种众包知识验证环境下众包工人可靠性模型建立方法及装置。
背景技术
知识图谱是由谷歌公司(Google)率先提出的,为了提高用户的检索效率,让计算机能像人一样能理解海量的信息,其研究和应用受到学术界和工业界的广泛关注。由于知识图谱是一个动态构建的过程,需要不断验证新加入的知识。目前,主要通过在线众包服务来进行知识验证,即向一群众包工人投递知识,使多个众包工人验证知识以获得知识标签。其中,知识验证的准确度很大程度取决于建立的众包工人可靠性模型。
建立众包工人可靠性模型的典型方法是把众包环境建模成有限时域的马尔科夫决策过程(MDP),利用动态规划算法(DP)去刻画最优的策略,为了计算出选择实例验证的最优策略而提出了一种有效的近似策略方法,名叫乐观知识梯度(optimistic knowledgegradient,后面都简称为Opt-KG),通过Opt-KG方法去计算得出最优策略,然后根据策略去选择实例去验证,以获得更优的策略。而当应用于大规模的知识图谱时,Opt-KG方法不能自由选择实例-工人对,且只能评估众包工人的可靠性,无法筛选和更新众包工人的资格,使得众包工人可以控制对知识打上真实标签的比例来保持其可靠性,在知识验证过程中引入虚假的知识标签。另外,不同众包工人对不同知识领域的掌握水平不同、工作认真程度不同,Opt-KG方法仅依赖标注知识难度并不足以确定众包工人的可靠性。
发明内容
本发明提供一种众包知识验证环境下众包工人可靠性模型建立方法及装置,以克服现有技术的缺陷,本发明能够基于强化学习,在众包验证环境下建立众包工人可靠性模型,实现对众包工人进行资格筛选,从而提高众包知识验证的效率。
为了解决上述技术问题,第一方面,本发明一实施例提供一种众包知识验证环境下众包工人可靠性模型建立方法,包括:
根据预存策略,对众包用户匹配知识领域集,并向所述众包用户分配所述知识领域集中的知识,使所述众包用户验证所述知识,得到知识标签;
基于强化学习算法建立众包工人可靠性模型,并通过所述众包工人可靠性模型计算所述知识标签的奖励值,以根据所述奖励值更新所述预存策略;
重复执行上述操作直至所述预存策略的更新次数达到预设次数,根据最新的所述预存策略对所述众包用户进行资格筛选;
在知识验证完成后,将验证正确的所述知识加入对应的知识图谱。
进一步地,在所述根据预存策略,对众包用户匹配知识领域集,并向所述众包用户分配所述知识领域集中的知识,使所述众包用户验证所述知识,得到知识标签之前,还包括:
根据用户的输入信息,对所述用户进行身份认证和资格审核,并在所述用户通过身份认证和资格审核时,将所述用户确定为所述众包用户。
进一步地,所述通过所述众包工人可靠性模型计算所述知识标签的奖励值,具体为:
若所述知识为已验证知识,则根据所述知识的真实标签计算所述知识标签的奖励值;
若所述知识为未验证知识,则根据所述知识的历史标签计算所述知识标签的奖励值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010179259.2/2.html,转载请声明来源钻瓜专利网。