[发明专利]基于知识图谱的实体检索方法、装置、设备以及存储介质在审
申请号: | 202110998454.2 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113704494A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李薿;骆金昌;王海威;和为 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28 |
代理公司: | 北京市通商律师事务所 11951 | 代理人: | 巩靖 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 实体 检索 方法 装置 设备 以及 存储 介质 | ||
1.一种基于知识图谱的实体检索方法,包括:
构建包含多个第一实体、以及第一实体之间的关联关系的知识图谱;
根据输入的检索信息,从所述第一实体中确定与所述检索信息匹配的第二实体;
基于所述知识图谱,确定与所述第二实体具有关联关系的至少一个第三实体;
确定每个所述第三实体的价值度,并基于每个所述第三实体的价值度对各所述第三实体进行排序。
2.根据权利要求1所述的方法,其中,所述从所述第一实体中确定与所述检索信息匹配的第二实体,包括:
确定所述检索信息与每个所述第一实体的相似度;
将对应的相似度最高的所述第一实体作为第二实体。
3.根据权利要求2所述的方法,其中,所述确定所述检索信息与每个所述第一实体的相似度,包括:
确定所述检索信息与每个所述第一实体的字面相似度和语义相似度之中的至少一个。
4.根据权利要求2所述的方法,其中,所述相似度包括字面相似度和语义相似度;将对应的相似度最高的所述第一实体作为第二实体,包括:
基于所述第一实体对应的字面相似度和语义相似度,计算所述第一实体对应的综合相似度;
将对应的综合相似度最高的所述第一实体作为第二实体。
5.根据权利要求4所述的方法,其中,所述基于所述第一实体对应的字面相似度和语义相似度,计算所述第一实体对应的综合相似度,包括:
基于所述第一实体对应的字面相似度、所述字面相似度的权重系数、语义相似度、以及所述语义相似度的权重系数,计算所述第一实体对应的加权相似度,其中,所述字面相似度的权重系数小于所述语义相似度的权重系数;
将所述第一实体对应的加权相似度作为所述第一实体对应的综合相似度。
6.根据权利要求1-5中任一项所述的方法,其中,所述第三实体的价值度包括:所述第三实体与所述第二实体的关联关系的置信度、以及针对所述第三实体的关注度;
所述确定每个所述第三实体的价值度,并基于每个所述第三实体的价值度对各所述第三实体进行排序,包括:
确定每个所述第三实体与所述第二实体的关联关系的置信度、以及针对每个所述第三实体的关注度;
基于每个所述第三实体对应的置信度和关注度,对各所述第三实体进行排序。
7.根据权利要求6所述的方法,所述针对所述第三实体的关注度包括:针对所述第三实体的检索频次和针对所述第三实体的浏览频次。
8.一种基于知识图谱的实体检索装置,包括:
图谱构建模块,用于构建包含多个第一实体、以及第一实体之间的关联关系的知识图谱;
实体匹配模块,用于根据输入的检索信息,从所述第一实体中确定与所述检索信息匹配的第二实体;
实体检索模块,用于基于所述知识图谱,确定与所述第二实体具有关联关系的至少一个第三实体;
实体排序模块,用于确定每个所述第三实体的价值度,并基于每个所述第三实体的价值度对各所述第三实体进行排序。
9.根据权利要求8所述的装置,其中,所述实体匹配模块在用于从所述第一实体中确定与所述检索信息匹配的第二实体时,具体用于:
确定所述检索信息与每个所述第一实体的相似度;
将对应的相似度最高的所述第一实体作为第二实体。
10.根据权利要求9所述的装置,其中,所述实体匹配模块在用于确定所述检索信息与每个所述第一实体的相似度时,具体用于:
确定所述检索信息与每个所述第一实体的字面相似度和语义相似度之中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110998454.2/1.html,转载请声明来源钻瓜专利网。