[发明专利]实体链接的方法、装置、电子设备和存储介质在审
申请号: | 202210499774.8 | 申请日: | 2022-05-09 |
公开(公告)号: | CN114969358A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 程飞;张浩宇;吴飞;方四安 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/279;G06F40/30;G06K9/62 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 尚文文 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 链接 方法 装置 电子设备 存储 介质 | ||
本申请提出一种实体链接的方法、装置、电子设备和存储介质,方法包括分别计算待链接实体与实体库中的各个候选实体的字相似度、词相似度和语义相似度;根据待链接实体与各个候选实体的字相似度、词相似度和语义相似度,确定待链接实体与各个候选实体的实体相似度;将与待链接实体的实体相似度最高的候选实体,确定为与待链接实体对应的链接实体,本申请能够从字相似度、词相似度和语义相似度三个维度确定待链接实体与候选实体的实体相似度,有效提高短文本的相似度计算的准确率,满足短文本实体链接需求。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种实体链接的方法、装置、电子设备和存储介质。
背景技术
知识图谱是一种通过图链接的抽象符号来表示物理世界和认知世界的方式,并作为不同个体认知世界、交换信息的桥梁。在构建知识图谱的过程中,实体链接是较为关键的步骤,其主要作用是让实体指称项正确链接到知识库中无歧义的候选实体。
基于实体相似度算法是实体链接过程中常见的方法。但是,由于短文本存在长度较短、特征稀缺、上下文不丰富等特点,使得通过实体相似度算法处理短文本的实体链接过程中,难以有效进行相似度计算,无法满足实体链接需求。
发明内容
基于上述需求,本申请提出一种实体链接的方法、装置、电子设备和存储介质,该方法能够用于克服现有技术中的无法满足短文本的实体链接需求的问题。
本申请提出的技术方案具体如下:
一方面,本申请提供了一种实体链接的方法,包括:
分别计算待链接实体与实体库中的各个候选实体的字相似度、词相似度和语义相似度;
根据待链接实体与各个候选实体的字相似度、词相似度和语义相似度,确定所述待链接实体与各个候选实体的实体相似度;
将与待链接实体的实体相似度最高的候选实体,确定为与待链接实体对应的链接实体。
另一方面,本申请提供了一种实体链接的装置,包括:
计算模块,用于分别计算待链接实体与实体库中的各个候选实体的字相似度、词相似度和语义相似度;
第一确定模块,用于根据待链接实体与各个候选实体的字相似度、词相似度和语义相似度,确定所述待链接实体与各个候选实体的实体相似度;
第二确定模块,用于将与待链接实体的实体相似度最高的候选实体,确定为与待链接实体对应的链接实体。
另一方面,本申请提供了一种电子设备,包括:
存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器,用于通过运行所述存储器中的程序,实现以上任意一项所述的实体链接的方法。
另一方面,本申请提供了一种存储介质,包括:所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现以上任意一项所述的实体链接的方法的各个步骤。
本申请的实体链接的方法,分别计算待链接实体与实体库中的各个候选实体的字相似度、词相似度和语义相似度;根据待链接实体与各个候选实体的字相似度、词相似度和语义相似度,确定待链接实体与各个候选实体的实体相似度;将与待链接实体的实体相似度最高的候选实体,确定为与待链接实体对应的链接实体。本申请的方案中,从字相似度、词相似度和语义相似度三个维度确定待链接实体与候选实体的相似度,有效提高相似度计算的准确率。
对于短文本来说,即使短文本存在长度较短、特征稀缺、上下文不丰富等特点,本申请的方案亦能够从字相似度、词相似度和语义相似度三个维度确定待链接实体与候选实体的实体相似度,有效提高短文本的相似度计算的准确率,满足短文本实体链接需求。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210499774.8/2.html,转载请声明来源钻瓜专利网。