[发明专利]一种实体嵌入方法及装置在审
申请号: | 201810975481.6 | 申请日: | 2018-08-24 |
公开(公告)号: | CN110895567A | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 夏劲夫;郑凯;段立新;江建军;彭作文 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 嵌入 方法 装置 | ||
1.一种实体嵌入方法,其特征在于,包括:
针对知识图谱中的每个实体,计算该实体转移至该实体的相邻实体的实体关系转移概率;
根据目标实体的各实体关系转移概率,以及该目标实体的预设跳转步数,确定目标实体对应的所有参考实体;
基于所述目标实体及所述目标实体对应的所有参考实体,计算所述目标实体的特征向量;其中,所述特征向量用于反映所述目标实体与所有参考实体之间的实体关系。
2.根据权利要求1所述的方法,其特征在于,所述计算该实体转移至该实体的相邻实体的实体关系转移概率,包括:
针对知识图谱中的每个实体,获取该实体与该实体的相邻实体之间的实体关系;
针对获取的实体关系中的第一实体关系,确定该实体和与该实体的相邻实体之间的实体关系中,第一实体关系所占的比率;
统计所述第一实体关系在所述知识图谱的三元组中出现的次数;
根据统计次数,以及所述三元组的数量,确定所述第一实体关系对应的逆向三元组概率;
基于所述第一实体关系比率和所述逆向三元组概率,得到所述第一实体关系转移概率。
3.根据权利要求1所述的方法,其特征在于,所述根据目标实体的各实体关系转移概率,以及该目标实体的预设跳转步数,确定目标实体对应的所有参考实体,包括:
针对所述目标实体转移至该目标实体的相邻实体的第二实体关系转移概率,以及该目标实体与该目标实体的相邻实体之间的预设跳转概率,选取所述目标实体对应所述第二实体关系的参考实体;
基于选取的所述参考实体转移至该参考实体的相邻实体的所述第二实体关系转移概率,以及该参考实体与该参考实体的相邻实体之间的预设跳转概率,选取所述参考实体对应所述第二实体关系的参考实体,直至在达到预设跳转步数时,得到所述目标实体对应所述第二实体关系的所有参考实体;
获取所述目标实体对应的所有实体关系对应的所有参考实体,得到所述目标实体对应的所有参考实体。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标实体及所述目标实体对应的所有参考实体,计算所述目标实体的特征向量,包括:
基于所述目标实体及所述目标实体对应的所有参考实体,构建所述目标实体对应的局部子图;
针对所述局部子图中的每一实体关系,获取该实体关系对应的参考实体,组合所述局部子图中该实体关系对应的各实体的原向量,得到所述目标实体的该实体关系对应的原向量集合;
基于所述目标实体的各实体关系对应的原向量集合,计算得到所述目标实体对应的特征向量。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标实体的各实体关系对应的原向量集合,计算得到所述目标实体对应的特征向量,包括:
将所述各实体关系对应的原向量集合输入至预先训练好的实体嵌入模型中,利用该实体嵌入模型的内设参数计算得到所述目标实体对应的特征向量;其中,所述内设参数用于反映在所述局部子图中所述目标实体与所述目标实体的所有参考实体之间的已知关联强度。
6.根据权利要求4所述的方法,其特征在于,按照如下步骤确定每一实体的原向量:
将每一实体输入至预先训练好的词向量转换模型,得到该实体的原向量;
其中,按照如下步骤训练所述词向量转换模型:
获取样本实体;
从获取的样本实体中提取出对应的原向量;
将所述样本实体作为所述词向量转换模型的输入,将提取的所述原向量作为所述词向量转换模型的输出,训练所述词向量转换模型。
7.根据权利要求1所述的方法,其特征在于,还包括:
基于所述目标实体对应的特征向量替换表示所述目标实体的原向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810975481.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卷装长丝的网丝缺陷检测方法
- 下一篇:用于处理信息的方法和装置