[发明专利]一种实体嵌入方法及装置在审
申请号: | 201810975481.6 | 申请日: | 2018-08-24 |
公开(公告)号: | CN110895567A | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 夏劲夫;郑凯;段立新;江建军;彭作文 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 嵌入 方法 装置 | ||
本申请提供了一种实体嵌入方法及装置,其中,该方法包括:针对知识图谱中的每个实体,计算该实体转移至该实体的相邻实体的实体关系转移概率;根据目标实体的各实体关系转移概率,以及该目标实体的预设跳转步数,确定目标实体对应的所有参考实体;基于目标实体及目标实体对应的所有参考实体,计算目标实体的特征向量;其中,特征向量用于反映目标实体与所有参考实体之间的实体关系。本申请提高了实体的嵌入效果,使得后续知识图谱的构建和/或应用效果足够理想。
技术领域
本申请涉及大数据处理技术领域,具体而言,涉及一种实体嵌入方法及装置。
背景技术
知识图谱(Knowledge Graph)作为一种新的知识表示方法和数据管理模式,在自然语言处理、问题回答、信息检索等领域有着重要的应用。知识图谱旨在描述的是真实世界中存在的实体及其关系,一般可以采用三元组表示,该三元组包括头实体、尾实体和关系,实体之间是通过关系相互联结,形成了网状的知识结构。
实体嵌入是构建知识图谱的关键技术,其主要目的是应用低维度向量对实体及其关系进行建模。目前常用的实体嵌入方法均是围绕与目标实体直连的相邻实体来确定属于该目标实体的特征向量。
然而,上述直连方式的实体嵌入忽略了其他实体对目标实体的影响,对实体间关系的可靠性和强度的考虑不足,导致嵌入效果不佳,使得后续知识图谱的构建和/或应用效果不够理想。
发明内容
有鉴于此,本申请的目的在于提供一种实体嵌入方法及装置,能够充分考虑实体间的关系,提高实体嵌入效果。
第一方面,本申请实施例提供了一种实体嵌入方法,包括:
针对知识图谱中的每个实体,计算该实体转移至该实体的相邻实体的实体关系转移概率;
根据目标实体的各实体关系转移概率,以及该目标实体的预设跳转步数,确定目标实体对应的所有参考实体;
基于所述目标实体及所述目标实体对应的所有参考实体,计算所述目标实体的特征向量;其中,所述特征向量用于反映所述目标实体与所有参考实体之间的实体关系。
结合第一方面,本申请提供了第一方面的第一种可能的实施方式,其中,所述计算该实体转移至该实体的相邻实体的实体关系转移概率,包括:
针对知识图谱中的每个实体,获取该实体与该实体的相邻实体之间的实体关系;
针对获取的实体关系中的第一实体关系,确定该实体和与该实体的相邻实体之间的实体关系中,第一实体关系所占的比率;
统计所述第一实体关系在所述知识图谱的三元组中出现的次数;
根据统计次数,以及所述三元组的数量,确定所述第一实体关系对应的逆向三元组概率;
基于所述第一实体关系比率和所述逆向三元组概率,得到所述第一实体关系转移概率。
结合第一方面,本申请提供了第一方面的第二种可能的实施方式,其中,所述根据目标实体的各实体关系转移概率,以及该目标实体的预设跳转步数,确定目标实体对应的所有参考实体,包括:
针对所述目标实体转移至该目标实体的相邻实体的第二实体关系转移概率,以及该目标实体与该目标实体的相邻实体之间的预设跳转概率,选取所述目标实体对应所述第二实体关系的参考实体;
基于选取的所述参考实体转移至该参考实体的相邻实体的所述第二实体关系转移概率,以及该参考实体与该参考实体的相邻实体之间的预设跳转概率,选取所述参考实体对应所述第二实体关系的参考实体,直至在达到预设跳转步数时,得到所述目标实体对应所述第二实体关系的所有参考实体;
获取所述目标实体对应的所有实体关系对应的所有参考实体,得到所述目标实体对应的所有参考实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810975481.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卷装长丝的网丝缺陷检测方法
- 下一篇:用于处理信息的方法和装置