[发明专利]基于知识图谱的检索方法及装置在审
申请号: | 202111287340.3 | 申请日: | 2021-11-02 |
公开(公告)号: | CN113987126A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 侯昶宇;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F16/903 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李东海 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 检索 方法 装置 | ||
1.一种基于知识图谱的检索方法,其特征在于,包括:
获取检索语句,根据所述检索语句,在知识图谱中确定最小子图,并计算所述最小子图中各节点的中间中心度和图嵌入表示;
根据预先设置的中心度阈值,确定所述最小子图中的至少两个目标节点,所述目标节点为中间中心度高于所述中心度阈值的节点;
在所述至少两个目标节点构成基于时间信息的路径的情况下,计算所述路径上目标节点两两之间的图嵌入表示相似度;
若所述时间信息相邻的两个目标节点的图嵌入表示相似度均大于相似度阈值,将所述检索语句确定为事件类检索语句;
若存在所述时间信息相邻的两个目标节点的图嵌入表示相似度不大于相似度阈值,将所述检索语句确定为事实类检索语句。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述至少两个目标节点未构成基于时间信息的路径的情况下,将所述检索语句确定为事实类检索语句。
3.根据权利要求1或2所述的方法,其特征在于,将所述检索语句确定为事件类检索语句之后,还包括:
从所述路径上的第一个目标节点开始,依次确定当前目标节点的辅助节点,所述辅助节点为除目标节点以外的一度关系节点;
根据各目标节点和各目标节点的辅助节点,生成事件类检索结果。
4.根据权利要求3所述的方法,其特征在于,根据各目标节点和各目标节点的辅助节点,生成事件类检索结果,包括:
从所述路径上的第一个目标节点开始,依次将与当前目标节点的图嵌入表示相似度最高的辅助节点,确定为当前目标节点的目标辅助节点;
根据各目标节点以及各目标节点对应的目标辅助节点生成事件类检索结果。
5.根据权利要求1或2所述的方法,其特征在于,将所述检索语句确定为事实类检索语句之后,还包括:
将所述最小子图中的各节点分为至少两个社区;
选取各社区的中心节点,确定各中心节点的N度关系节点,其中,所述中心节点为社区中中间中心度最高的节点,N为大于零的正整数;
根据各中心节点和各中心节点的N度关系节点生成事实类检索结果。
6.根据权利要求5所述的方法,其特征在于,根据各中心节点和各中心节点的N度关系节点生成事实类检索结果,包括:
根据预先设置的权重表确定各中心节点、各N度关系节点的权重;
根据各中心节点、各N度关系节点的权重对所述中心节点、N度关系节点进行排序,生成事实类检索结果。
7.根据权利要求1所述的方法,其特征在于,根据所述检索语句,在知识图谱中确定最小子图,包括:
对所述检索语句进行分词和去停用词处理,得到所述检索语句的至少一个关键词;
在知识图谱中查找包含每个关键词的指定节点,根据所述指定节点和所述指定节点的二度关系节点构成最小子图。
8.根据权利要求1所述的方法,其特征在于,所述最小子图中包含M个节点,M为大于或等于3的正整数;
计算所述最小子图中各节点的中间中心度和图嵌入表示,包括:
计算所述最小子图中第i节点到第j节点的第一最短路径数,其中,i和j均为小于或等于M的正整数,且i不等于j;
确定所述第i节点和第j节点之间的最短路径中经过第k节点的第二最短路径数,k为小于或等于M的正整数,且k不等于i和j中的任意一个;
根据所述第一最短路径数和所述第二最短路径数确定所述第k节点的中间中心度;
通过图卷积神经网络获取所述第k节点的图嵌入表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111287340.3/1.html,转载请声明来源钻瓜专利网。