[发明专利]面向不完备知识图谱的关系链接方法在审
申请号: | 202011318513.9 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112417170A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 胡伟;赵耀;丁基伟 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F40/295;G06F40/35;G06K9/62 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 秦蕾 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 完备 知识 图谱 关系 链接 方法 | ||
本发明公开了一种面向不完备知识图谱的关系链接方法,包括以下步骤:对输入的自然语言问句进行关键词提取、命名实体和类型识别与消歧,得到实体与类型链接列表;进行依存分析,获得问句对应的语义依存树,然后进行语义化搜索,判断树中任意实体类型对之间是否存在直接依存关系,得到过滤的实体类型对集合;在知识图谱中枚举所有以过滤出的实体和类型为头节点,且长度小于阈值的关系路径,得到候选关系路径列表;分别利用预训练的语言模型和知识图谱表示学习模型,将问句和候选关系路径转化为向量表示,进行相似度比较,选取相似度最高的候选关系路径作为最终的关系链接结果。本发明实现了对自然语言问句关系的鲁棒准确链接。
技术领域
本发明涉及知识图谱和自然语言处理技术领域,尤其涉及一种面向不完备知识图谱的关系链接方法,具体是一种基于表示学习的面向不完备知识图谱的关系链接方法,特别是一种通过将自然语言问句和候选关系路径转化为向量进行相似度计算来实现面向关系路径的关系链接方法。
背景技术
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。知识图谱旨在描述真实世界中存在的各种实体或概念及其相互关系。其中,每个实体或概念用一个全局唯一确定的统一资源标识符来标识。每个属性-值对用来刻画实体的内在特性,而关系用来链接两个实体,刻画它们之间的关联。知识图谱也可以被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。现在比较流行的知识图谱有DBpedia、Wikidata、Freebase、YAGO等,然而这些知识图谱仍然是不完备的。
自然语言处理(natural language processing)是研究人类用自然语言与计算机之间进行通信的技术,属于语言学、计算机科学、认知科学等相关学科的交叉学科,涉及范围广泛。此领域研究人与计算机交互的语言问题,探讨如何处理及运用自然语言,特别是如何编程计算机以成功处理大量的自然语言数据。处理自然语言的关键是要让计算机“理解”自然语言,自然语言处理的关键技术包括自然语句的分词、词性标注、命名实体识别、指代消解、句法依存分析等,可用于处理语音识别、文本分类、信息检索和智能问答等下游任务。
关系链接(relation linking)是帮助在自然语言问句和知识图谱之间建立映射关系的一种技术,旨在将自然语言问句中表达关系的单词短语链接到知识图谱中对应的边上。相似地,实体链接技术是将自然语言问句中的实体词汇链接到知识图谱中对应的节点上。实体链接技术已经成为较为成熟的研究,然而关系链接技术却很少受到关注。
发明内容
发明目的:针对上述现有技术存在的问题和不足,本发明的目的是提供一种面向不完备知识图谱的关系链接方法。在关系链接过程中,使用知识图谱和自然语言处理技术对自然语言问句和候选关系路径进行向量转化,从而实现对自然语言问句关系的鲁棒准确链接。
技术方案:为实现上述发明目的,本发明采用的技术方案为一种面向不完备知识图谱的关系链接方法,包括以下步骤:
(1.1)对于输入的一个自然语言问句,提取所述自然语言问句中的关键词,进行命名实体识别与消歧、类型识别与消歧,生成实体与类型链接列表;
(1.2)基于所述步骤(1.1)得到的实体与类型链接列表,进行依存分析,获得所述自然语言问句所对应的语义依存树,然后根据规则将所述语义依存树转化为有向图,并在所述有向图中进行语义化搜索,得到过滤实体类型对集合;
(1.3)基于所述步骤(1.2)得到的实体类型对集合,在知识图谱中枚举所有以过滤出的实体和类型为头节点,且长度小于阈值的关系路径,得到候选关系路径列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011318513.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种塑料袋口集束后的胶带扎口装置
- 下一篇:一种滚针碾压式单螺杆分散挤出机