[发明专利]一种用于规则判定的知识众包平台构建方法在审
申请号: | 202110205157.8 | 申请日: | 2021-02-24 |
公开(公告)号: | CN112989062A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 杨静;石晓雯 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06F40/44 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 规则 判定 知识 平台 构建 方法 | ||
本发明公开了一种用于规则判定的知识众包平台构建方法,该方法包括以下步骤:从候选规则集中选择未标注的规则形成标注任务;根据规则难度定义算法,为所述标注任务中的每条规则定义难度等级;为不同难度等级的规则设计不同的规则呈现方式,展示在用户交互界面中;具体有实例型、自然语言型和知识图谱型;基于给出的规则呈现方式,引导用户完成对目标规则数据的标注,统计规则判定结果。本发明在对规则数据标注前,先通过分析任务的难度,提供最适合的规则呈现形式,简化众包任务的难度,解决采用众包方式判定规则过程中遇到的困难,生成高质量的规则。
技术领域
本发明涉及计算机技术领域,具体涉及人工混合智能领域,尤其涉及到一种用于规则判定的知识众包平台构建方法。
背景技术
现有的知识众包平台基本采用对知识库中的三元组进行判定的方法对知识库进行精化,而知识库中的三元组数量非常庞大,这种方法通常需要采用大量的人力物力,效率非常低。
知识图谱是知识库的呈现方式,规则的出现可以对知识图谱进行填充(添加新的边)或者发现矛盾的数据进行纠错,大大提升了精化的效率。但规则的判定同样对于知识库(知识图谱)的构建很重要。由于谓词逻辑形式表示下的规则不易于理解,目前大多方法采用专家标注,标注成本高昂。如何降低规则的理解难度,使大多数普通人也可以参与其中,成为现阶段亟待解决的问题。
发明内容
本发明的目的是提供一种用于规则判定的知识众包平台构建方法,该方法能够降低规则的理解难度,使普通人也参与到规则判定的众包任务中贡献知识,减小标注成本。
为了实现上述目的,本发明的具体技术方案如下:
一种用于规则判定的知识众包平台构建方法,该方法包括以下步骤:
步骤1:从候选规则集中选择未标注的规则形成标注任务;
步骤2:根据规则难度定义算法,为所述候选规则集中的每条规则定义难度等级;
步骤3:为不同难度等级的规则设计不同的规则呈现方式,展示在用户交互界面中;所述规则呈现方式具体有实例型、自然语言型和知识图谱型;
步骤4:基于给出的规则呈现方式,引导用户完成对目标规则数据的标注,统计规则判定结果。
步骤2所述根据规则难度定义算法为:
根据规则的长度以及规则实例的出现频次,根据赋予的不同权重进行相加,计算得出规则的难度等级得分;其中:
所述规则的长度为规则中包含的三元组个数;每个三元组包含头实体、关系和尾实体,三元组之间用逻辑运算符相连;
所述规则实例为每个三元组中出现的头实体、关系和尾实体在知识库中的实例的相加总和;
结合以上两个因素,给出了规则难度的定义。难度等级按以下公式计算:
其中Nrule是规则的总三元组个数,是遍历每一个三元组后总的实例数;α是一个用来平衡两者影响力的超参数。
所述步骤3具体为:
根据所述每条规则定义的难度等级,分别设计并给出规则呈现方式中的一种,并显示在界面中使用户知晓目标规则;
其中,规则呈现方式有:实例型、图谱型和自然语言型;
实例型的呈现方式包括:获取规则中三元组中各实体在知识库中的实例,对应的显示在规则中的各实体位置下;
图谱型的呈现方式包括:根据图谱生成算法,将谓词逻辑下的规则自动地画成图谱解释形式;
自然语言型的呈现方式包括:根据自然语言生成算法,将谓词逻辑下的规则翻译为自然语言的形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110205157.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗冻混凝土及其制备方法
- 下一篇:一种水果规格分选机