[发明专利]实体确定方法、装置及存储介质有效
申请号: | 201910177268.5 | 申请日: | 2019-03-08 |
公开(公告)号: | CN109918669B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 赵创钿;谢润泉;连凤宗 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 确定 方法 装置 存储 介质 | ||
1.一种实体确定方法,其特征在于,所述方法包括:
提取目标文本信息中的目标语句;
获取备选实体集合,所述备选实体集合中包括多个备选实体;
获取所述多个备选实体中的每个备选实体与所述目标语句的相关度;
根据获取的多个相关度,确定所述目标文本信息的目标实体,所述目标实体与所述目标语句的相关度大于所述多个备选实体中的其他备选实体与所述目标语句的相关度;
根据所述目标文本信息、所述目标实体和所述目标实体的描述文本信息中的至少一个,获取所述目标实体与所述目标文本信息的相关度;
所述方法还包括以下至少一项:
获取所述目标实体的历史搜索记录,所述历史搜索记录包括以所述目标实体为关键词进行搜索得到的搜索结果,根据所述历史搜索记录获取所述描述文本信息;
获取所述目标实体的历史访问记录,所述历史访问记录包括以所述目标实体为关键词进行搜索得到后执行访问操作的搜索结果,根据所述历史访问记录获取所述描述文本信息;
获取包括多个实体的关联图,所述关联图中任两个关联的实体连接,根据所述关联图,获取与所述目标实体连接的至少一个实体,将所述至少一个实体作为所述目标实体的描述文本信息;
获取发布者为所述目标实体的通知消息,根据所述通知消息获取所述描述文本信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述多个备选实体中的每个备选实体与所述目标语句的相关度,包括:
获取所述目标语句的第一向量;
对于所述每个备选实体,获取所述备选实体的第二向量,将所述第二向量与所述第一向量的相关度确定为所述备选实体与所述目标语句的相关度。
3.根据权利要求1所述的方法,其特征在于,所述根据获取的多个相关度,确定所述目标文本信息的目标实体,包括以下至少一项:
根据所述多个相关度的排列顺序,选取预设数量的相关度,且选取的相关度大于所述多个相关度中的其他相关度,将所述选取的相关度对应的备选实体确定为所述目标实体;
根据所述多个相关度,选取大于预设阈值的相关度,将选取的相关度对应的备选实体确定为所述目标实体。
4.根据权利要求1所述的方法,其特征在于,所述根据获取的多个相关度,确定所述目标文本信息的目标实体之后,所述方法还包括:
如果已确定所述目标文本信息的多个目标实体,且所述多个目标实体中包括含义相同的多个指定实体,将所述多个指定实体替换为与所述多个指定实体含义相同的一个实体。
5.根据权利要求4所述的方法,其特征在于,所述如果已确定所述目标文本信息的多个目标实体,且所述多个目标实体中包括含义相同的多个指定实体,将所述多个指定实体替换为与所述多个指定实体含义相同的一个实体,包括:
获取预设关联关系,所述预设关联关系中包括至少一个关联条目,每个关联条目包括含义相同的多个实体;
根据所述多个目标实体,分别查询所述预设关联关系,得到每个目标实体所属的关联条目;
当确定所述多个目标实体中的多个指定实体属于同一个关联条目时,将所述多个指定实体替换为所述关联条目中的任一个实体。
6.根据权利要求1所述的方法,其特征在于,所述获取备选实体集合之后,所述方法还包括:
对所述目标文本信息进行分词处理,得到所述目标文本信息中的至少一个词语;
将所述至少一个词语中所述备选实体集合包括的词语确定为所述目标文本信息的目标实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910177268.5/1.html,转载请声明来源钻瓜专利网。