[发明专利]知识图谱的节点分类方法及系统有效
申请号: | 202011311415.2 | 申请日: | 2020-11-20 |
公开(公告)号: | CN112559737B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 赵九州;侯乐;胡碧峰;胡茂海;李文锋 | 申请(专利权)人: | 和美(深圳)信息技术股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 安娜 |
地址: | 518040 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 节点 分类 方法 系统 | ||
1.一种知识图谱的节点分类方法,其特征在于,包括:
提取节点的自身属性特征以及与所述节点相关的其它节点的节点关系特征,将所述节点的自身属性特征以及节点关系特征作为所述节点的联合特征;
计算所述节点的各个邻居节点的节点度值以及网页排名值,并根据各个邻居节点的节点度值以及网页排名值对邻居节点进行过滤,并将过滤之后的邻居节点进行聚合,得到聚合的邻居特征;
根据所述节点的联合特征以及所述聚合的邻居特征,训练得到用于对知识图谱的节点进行分类的目标分类器;
所述将过滤之后的邻居节点进行聚合,得到聚合的邻居特征的步骤具体表示为:
其中,Q、K、V表示将过滤后的邻居节点的的联合特征进行拼接得到的矩阵,d表示缩放因子,hu_agg表示聚合得到的邻居特征,所述根据所述节点的联合特征以及所述聚合的邻居特征,训练得到用于对知识图谱的节点进行分类的目标分类器的步骤包括:
根据所述节点联合特征以及所述聚合的邻居特征进行加权求和;
将所述加权求和得到的值输入到初始分类器,所述初始分类器包括图神经网络、一个全连接层和一个softmax层;所述初始分类器的损失函数为交叉熵损失函数;
最小化所述交叉熵损失函数,训练得到所述目标分类器,所述根据所述节点联合特征以及所述聚合的邻居特征进行加权求和的步骤具体表示为:
其中,σ表示非线性变换,Wk以及Bk均表示要学习的权重;表示节点当前层k的聚合特征,表示邻居节点上一层k-1的聚合特征,表示节点上一层k-1的聚合特征,所述根据各个邻居节点的节点度值以及网页排名值对邻居节点进行过滤的步骤包括:
将节点度值小于第一预设阈值且网页排名值小于第二预设阈值的邻居节点滤除。
2.一种知识图谱的节点分类系统,其特征在于,包括:
自身特征获取单元,用于提取节点的自身属性特征以及与所述节点相关的其它节点的节点关系特征,将所述节点的自身属性特征以及节点关系特征作为所述节点的联合特征;
邻居特征获取单元,用于计算所述节点的各个邻居节点的节点度值以及网页排名值,并根据各个邻居节点的节点度值以及网页排名值对邻居节点进行过滤,并将过滤之后的邻居节点进行聚合,得到聚合的邻居特征;
分类器训练单元,用于根据所述节点的联合特征以及所述聚合的邻居特征,训练得到用于对知识图谱的节点进行分类的目标分类器;
所述邻居特征获取单元用于根据下述公式进行聚合,得到聚合的邻居特征:
其中,Q、K、V表示将过滤后的邻居节点的的联合特征进行拼接得到的矩阵,d表示缩放因子,hu_agg表示聚合得到的邻居特征,所述分类器训练单元包括:
加权处理子单元,用于根据所述节点联合特征以及所述聚合的邻居特征进行加权求和;
学习训练子单元,用于将所述加权求和得到的值输入到初始分类器,所述初始分类器包括图神经网络、一个全连接层和一个softmax层;所述初始分类器的损失函数为交叉熵损失函数;最小化所述交叉熵损失函数,训练得到所述目标分类器,所述加权处理子单元具体用于根据下述公式进行加权求和:
其中,σ表示非线性变换,Wk以及Bk均表示要学习的权重;表示节点当前层k的聚合特征,表示邻居节点上一层k-1的聚合特征,表示节点上一层k-1的聚合特征,所述邻居特征获取单元具体用于将节点度值小于第一预设阈值且网页排名值小于第二预设阈值的邻居节点滤除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和美(深圳)信息技术股份有限公司,未经和美(深圳)信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011311415.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锻造齿轮模具
- 下一篇:一种水中镍离子含量的测定方法