[发明专利]知识数据的处理方法和装置有效

专利信息
申请号: 201510640181.9 申请日: 2015-09-30
公开(公告)号: CN105354224B 公开(公告)日: 2019-07-23
发明(设计)人: 张志明;张俊彬;王波;李羽;李浩 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/2455 分类号: G06F16/2455;G06N5/02
代理公司: 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人: 田宏宾
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 知识 数据 处理 方法 装置
【说明书】:

发明实施例公开了一种知识数据的处理方法和装置。所述处理方法包括:获取待检测的知识数据;从所述待检测的知识数据提取主体、谓词和客体的数据,得到相应的第一结构化知识数据;根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突。采用本发明实施例,便于后续对存在信息冲突的知识数据的正确性做进一步判别,以提高知识库中知识数据的准确率。

技术领域

本发明涉及计算机技术领域,特别涉及一种知识数据的处理方法和装置。

背景技术

随着网络技术的发展,互联网已成为人们获取知识的重要手段之一,基于互联网的知识库应运而生。由于互联网的知识库通常由多个知识数据源构成,而不同知识数据源中同一个知识主题的知识数据可能不同,甚至会存在彼此冲突或错误,因此,在使用多个知识数据源中的知识数据构建知识库时,需要对其中的知识数据进行检测。

通常,可使用较简单的属性约束规则对知识数据进行检测,即将知识数据中的主体和/或客体的属性信息(如性别、年龄等)与预先设置的属性约束条件对比,如果主体和/或客体的属性信息满足属性约束条件,则该知识数据是正确的,如果主体和/或客体的属性信息不满足属性约束条件,则该知识数据是错误的。

前述知识数据的处理方法至少存在以下问题:

通过上述处理方法并不能够检测出知识库中存在信息冲突的所有知识数据,而仅能够检测出很少的一部分知识数据存在错误,知识库中仍然存在大量相互冲突的知识数据,从而使得知识库中知识数据的准确率较低。

发明内容

本发明的实施例提供一种知识数据的处理方法和装置,通过将由待检测的知识数据得到的第一结构化知识数据和已有的第二结构化知识数据进行比对,确定待检测的知识数据是否与已有的知识数据存在信息冲突,便于后续对存在信息冲突的知识数据的正确性做进一步判别,以提高知识库中知识数据的准确率。

为达到上述目的,本发明的实施例提供了一种知识数据的处理方法。所述处理方法包括,获取待检测的知识数据;从所述待检测的知识数据提取主体、谓词和客体的数据,得到相应的第一结构化知识数据;根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突。

可选地,所述知识冲突检测规则包括至少一个以下规则:主体冲突检测规则、谓词冲突检测规则和客体冲突检测规则。

可选地,所述处理方法还包括:根据预设的属性约束检测规则对所述第一结构化知识数据中的主体和/或客体的属性信息进行分析,确定所述第一结构化知识数据是否满足预设的属性约束条件,其中,所述属性信息包括性别信息、民族信息、年龄信息和/或体重信息。

可选地,所述根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突的处理包括:如果所述第二结构化知识数据中的任一结构化知识数据与所述第一结构化知识数据中主体、谓词和客体中的任意两项的内容信息相同,剩余项的内容信息不同,则确定所述第一结构化知识数据与所述第二结构化知识数据存在信息冲突。

可选地,所述处理方法还包括:如果所述第二结构化知识数据与所述第一结构化知识数据中主体、谓词和客体中的至少两项的内容信息不同,则将所述第一结构化知识数据标注为所述第二结构化知识数据。

可选地,所述第一结构化知识数据和所述第二结构化知识数据分别通过包括主体、谓词和客体的数据的三元组表征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510640181.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top