[发明专利]一种知识图谱异常社区检测方法及装置在审
申请号: | 202010044369.8 | 申请日: | 2020-01-15 |
公开(公告)号: | CN111209317A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 王成;胡瑞鑫;朱航宇 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06Q50/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 异常 社区 检测 方法 装置 | ||
1.一种知识图谱异常社区检测方法,其特征在于,包括以下步骤:
步骤一,根据应用场景及数据集,构建异质知识图谱;
步骤二,从所述异质知识图谱提取一个仅有实体的同质网络;
步骤三,对所述同质网络中的每一连通子图,使用网络嵌入技术获得各连通子图的节点距离向量;
步骤四,基于所述节点距离向量对各连通子图进行聚类,生成社区;
步骤五,根据每个社区内异常标签数据和正常标签数据的比例判断对应社区是否为异常社区。
2.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述步骤一中,根据应用场景获得数据集的有效特征,基于所述有效特征获得构建知识图谱所需的实体和关系,获得所述异质知识图谱。
3.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述步骤二中,基于图数据库提取所述同质网络。
4.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述同质网络中,基于两个实体间的关系数量设置对应实体间的边权重。
5.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述步骤五中,若异常标签数据和正常标签数据的比例超过设定阈值,则判定该社区为异常社区,反之,则为正常社区;
若社区内无标签数据,则判定该社区为正常社区或者判定该社区为灰色社区。
6.一种知识图谱异常社区检测装置,其特征在于,包括:
异质知识图谱构建模块,用于根据应用场景及数据集,构建异质知识图谱;
同质网络提取模块,用于从所述异质知识图谱提取一个仅有实体的同质网络;
距离向量获取模块,用于对所述同质网络中的每一连通子图,使用网络嵌入技术获得各连通子图的节点距离向量;
聚类模块,用于基于所述节点距离向量对各连通子图进行聚类,生成社区;
判断模块,用于根据每个社区内异常标签数据和正常标签数据的比例判断对应社区是否为异常社区。
7.根据权利要求6所述的知识图谱异常社区检测装置,其特征在于,所述异质知识图谱构建模块中,根据应用场景获得数据集的有效特征,基于所述有效特征获得构建知识图谱所需的实体和关系,获得所述异质知识图谱。
8.根据权利要求6所述的知识图谱异常社区检测装置,其特征在于,所述同质网络提取模块中,基于图数据库提取所述同质网络。
9.根据权利要求6所述的知识图谱异常社区检测装置,其特征在于,所述同质网络中,基于两个实体间的关系数量设置对应实体间的边权重。
10.根据权利要求6所述的知识图谱异常社区检测装置,其特征在于,所述判断模块中,若异常标签数据和正常标签数据的比例超过设定阈值,则判定该社区为异常社区,反之,则为正常社区;
若社区内无标签数据,则判定该社区为正常社区或者判定该社区为灰色社区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010044369.8/1.html,转载请声明来源钻瓜专利网。