[发明专利]实体链指方法、装置、电子设备及存储介质在审
申请号: | 202010886164.4 | 申请日: | 2020-08-28 |
公开(公告)号: | CN111931509A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 张小彬;付志宏;黄定帮;罗希意;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种实体链指方法、装置、电子设备及存储介质,涉及人工智能技术领域及自然语言处理技术领域。具体实现方案为:对查询文本进行实体检测,获取目标实体;采用预先训练的上下文表达模型,生成所述查询文本的特征表达;基于所述查询文本的特征表达和预先获取的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别。本申请基于上下文表达模型获取的查询文本的特征表达以及预先获取的各实体类别的特征表达,均能够对相关信息进行有效地泛化,保证查询文本的特征表达以及各实体类别的特征表达的准确性,进而能够有效地提高实体链指的准确性。
技术领域
本申请涉及计算机技术领域,尤其涉及人工智能技术领域及自然语言处理技术领域,具体涉及一种实体链指方法、装置、电子设备及存储介质。
背景技术
在自然语言处理(Natural Language Processing;NLP)中,命名实体识别(NamedEntity Recognition;NER)属于信息抽取的一个子任务。给定一段非结构化文本,NER的目的是确定其中的实体的位置和归属的类别。
实体链指(Entity Linking;EL)是NER中的一个重要环,EL是链指文本中的目标实体词到唯一且具体的实体上的一项任务。从某种程度上来讲,EL实现的是消歧任务,消岐的主要依据是上下文语境和不同实体之间的匹配程度。譬如仅仅给定“苹果”这个词是无法做实体的消歧,但是如果说“吃个苹果”或者“苹果手机”就能判断出前者指的是水果对应的实体,后者指的是品牌对应的实体。现有的实体链指技术,主要是预先人工提取各实体类别的实体相关的一些共现特征,然后根据文本中的实体的上下文,与各实体类别的实体的共现特征做匹配,并给出打分。最后选出打分最高的类别的实体作为实体链指的结果。
但是,现有的实体链指方法中,各类别的实体相关的一些共现特征仅仅抽取了字面的特征信息,无法进行有效地泛化,导致实体链指的准确性较差。
发明内容
为了解决上述技术问题,本申请提供了一种实体链指方法、装置、电子设备及存储介质。
根据本申请的一方面,提供了一种实体链指方法,其中,所述方法包括如下步骤:
对查询文本进行实体检测,获取目标实体;
采用预先训练的上下文表达模型,生成所述查询文本的特征表达;
基于所述查询文本的特征表达和预先获取的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别。
根据本申请的另一方面,提供了一种实体链指装置,其中,所述装置包括:
检测模块,用于对查询文本进行实体检测,获取目标实体;
第一生成模块,用于采用预先训练的上下文表达模型,生成所述查询文本的特征表达;
链指模块,用于基于所述查询文本的特征表达和预先获取的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别。
根据本申请的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本申请的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010886164.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种管道内切割机
- 下一篇:一种融合边缘设施的云服务综合调度优化系统及方法