[发明专利]一种基于语义三角的领域知识图谱及查询方法在审
申请号: | 201710160270.2 | 申请日: | 2017-03-17 |
公开(公告)号: | CN106874261A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 王宏安;李依霖;朱嘉奇;刘胜航 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 三角 领域 知识 图谱 查询 方法 | ||
技术领域
本发明属于人工智能领域,具体涉及一种基于语义三角的领域知识图谱及查询方法。
背景技术
随着互联网技术的飞速发展,人类先后经历了以文档为主要特征的“Web 1.0”时代和以数据互联数据共享为特征的“Web 2.0”时代,并且正在走向基于知识互联的“Web3.0”时代。在大数据中表示一个可理解的知识网络,成为现代互联网时代的一大挑战。同样,人机交互的基础在于理解用户的言语信息、推断用户的意图进而由机器返回给用户结果。知识图谱以其强大的语义处理能力与开放互联的能力应运而生,能够将互联网中的海量、异构的数据聚集为可理解的知识网络,便于理解、应用。因此,如何表示某个特定领域的知识图谱并应用于特定的业务场景以解决相应的问题,具有十分重要的意义。
现有的知识图谱的表示大多描述的是实体之间的语义网络,每个实体(概念的外延)用一个全局唯一确定的ID来标识,采用主-谓-宾三元组的形式表示知识网络。但是这种表示方法会带来概念和实体的混淆,从而造成用户的理解障碍,并且不利于实体的理解。针对特定的问题,需要在存在海量数据和关系的知识图谱中查询,成本相对较高。传统的知识图谱还存在一词多义和一义多词的问题,使得语义网络混乱,不利于从互联网丰富的词语中整理出知识并进行快速查询。
语义三角是一种关于意义的理论,由英国学者奥格登(Ogden)和理查兹(Richards)在1923年出版的语义学重要著作《意义的意义》(The Meaning of Meaning)中提出,代表了传统语义学的典型观点。描述的是符号、概念(意义)和客观事物之间的一种相互制约、相互作用的关系,强调语言符号是对事物的指代,指代过程就是符号、概念(意义)和事物发生关系的过程。符号用来表示概念,概念是反映客观事物或者对象本质属性的思维形式,是词语的思想内容;概念反映现实世界中的客观事物即所指物。语义三角包括三方面的关系,分别是概念/意义和客观事物之间的直接关系,概念与符号/词之间的直接关系和符号或词与指称物/事物之间的非直接关系。
如何利用语义三角的思想,在特定领域为海量、异构的大数据表达、组织、管理和应用提供一种更为有效的方式,使得语义网络能够实现特定领域概念与实体的组织管理和快速查询的功能,是知识图谱当前亟待解决的问题之一。
发明内容
本发明针对上述问题,提出了一种基于语义三角的领域知识图谱及查询方法。该图谱将概念与实体分离,并用一个代表词和多个候选词作为概念或者实体的表示,实体之间的关系通过基于概念结点的超边建立,从而实现了知识网络的有效管理和快速查询。
本发明采用的技术方案如下:
基于语义三角的领域知识图谱由概念层、实体层组成,具体表示为以下五部分:
1.根据领域相关的知识构建概念层,概念层由概念的集合组成,每个概念设有唯一标识,并由一个代表词项和候选词项集合表示。概念对应语义三角中的概念/意义,是在该领域的客观事物的基础上概括而成的。候选词项集合中的每个候选词可以理解为代表词项的同义词或近义词,并以一定概率表示该概念。另外,概念层可以不止一层,可根据不同的业务场景细化概念层,使其更准确地刻画领域知识,满足具体的任务。
2.根据领域相关的知识和概念层的概念集合,实例化每个概念对应的多个实体,构成实体层。实体是概念的外延,每个实体设有唯一标识,并由一个代表词项和候选词项集合表示。实体通过概念层中的概念实例化(instanceOf)得到,即根据领域知识将实体对应到相关概念上。候选词项集合中的每个候选词可以理解为代表词项的同义词,以一定概率表示该实体。这里的概率可通过经验设定,也可基于统计分析的方法学习出来。
3.根据领域相关知识,通过经验规则推理或者统计学习等方法,表示概念层相关概念之间的关联关系。概念之间存在以下几种关系:
(1)概念与其属性之间的包含关系(has)。如果概念的属性也在概念层中作为一个概念出现,那么这两者之间的关系即为包含关系(has)。
(2)概念之间的隶属关系(isA)。如果一个概念是另外一个概念涵义的子集,则两者之间的关系即为隶属关系(isA)。
(3)概念之间的关联关系。如果概念之间存在其他关联关系,可根据具体领域定义特定的关联关系,比如扩展关系等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710160270.2/2.html,转载请声明来源钻瓜专利网。