[发明专利]实体链指方法、装置、电子设备及存储介质在审

专利信息
申请号: 202010886164.4 申请日: 2020-08-28
公开(公告)号: CN111931509A 公开(公告)日: 2020-11-13
发明(设计)人: 张小彬;付志宏;黄定帮;罗希意;何径舟 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人: 田宏宾
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 方法 装置 电子设备 存储 介质
【权利要求书】:

1.一种实体链指方法,其中,所述方法包括如下步骤:

对查询文本进行实体检测,获取目标实体;

采用预先训练的上下文表达模型,生成所述查询文本的特征表达;

基于所述查询文本的特征表达和预先获取的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别。

2.根据权利要求1所述的方法,其中,采用预先训练的上下文表达模型,生成所述查询文本的特征表达之后,基于所述查询文本的特征表达和预先获取的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别之前,所述方法还包括:

从预先生成的实体特征库中,获取所述目标实体对应的各实体类别的特征表达。

3.根据权利要求2所述的方法,其中,从预先生成的实体特征库中,获取所述目标实体对应的各实体类别的特征表达之前,所述方法还包括:

基于实体表达模型和所述目标实体的各实体类别,生成所述目标实体对应的各实体类别的特征表达;

将所述目标实体对应的各实体类别的特征表达存储在所述实体特征库中。

4.根据权利要求3所述的方法,其中,基于实体表达模型和所述目标实体的各实体类别,生成所述目标实体对应的各实体类别的特征表达,包括:

采集所述目标实体的各实体类别对应的数条训练样本对,各所述训练样本对中包括正样本和负样本,所述正样本中包括实体、以及与所述实体属于同一实体类别的正样本实体,所述负样本中包括所述实体、以及与所述正样本中的所述实体不属于同一实体类别的负样本实体;

采用所述数条训练样本对,训练所述实体表达模型,使得所述实体表达模型生成所述正样本标识的实体类别的特征表达与所述正样本实体的特征表达相匹配,而与所述负样本实体的特征表达不相匹配,进而得到所述目标实体的对应的实体类别的特征表达。

5.根据权利要求1所述的方法,其中,采用预先训练的上下文表达模型,生成所述查询文本的特征表达,包括:

对所述查询文本进行分词,得到多个分词;

将所述多个分词分别进行嵌入表达;

将嵌入表达后的所述多个分词输入至所述上下文表达模型中,并获取所述上下文表达模型输出的所述查询文本的特征表达。

6.根据权利要求1所述的方法,其中,对查询文本进行实体检测,获取目标实体之后,基于所述查询文本的特征表达和预先生成的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别之前,所述方法还包括:

检测并确定所述目标实体对应至少两个实体类别。

7.根据权利要求1-6任一所述方法,其中,对查询文本进行实体检测,获取目标实体,包括:

采用实体识别模型对所述查询文本进行实体检测,获取所述目标实体;和/或

采用预先生成的实体词典对所述查询文本进行实体检测,获取所述目标实体。

8.一种实体链指装置,其中,所述装置包括:

检测模块,用于对查询文本进行实体检测,获取目标实体;

第一生成模块,用于采用预先训练的上下文表达模型,生成所述查询文本的特征表达;

链指模块,用于基于所述查询文本的特征表达和预先获取的所述目标实体对应的各实体类别的特征表达,将所述目标实体链指到匹配程度最高的实体类别。

9.根据权利要求8所述的装置,其中,所述装置还包括:

获取模块,用于从预先生成的实体特征库中,获取所述目标实体对应的各实体类别的特征表达。

10.根据权利要求9所述的装置,其中,所述装置还包括:

第二生成模块,用于基于实体表达模型和所述目标实体的各实体类别,生成所述目标实体对应的各实体类别的特征表达;

存储模块,用于将所述目标实体对应的各实体类别的特征表达存储在所述实体特征库中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010886164.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top