[发明专利]一种异构网络中基于元路径的异常模体查询方法有效
申请号: | 201910136599.4 | 申请日: | 2019-02-25 |
公开(公告)号: | CN109935277B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 万良田;孙宇宸;于硕;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 刘秋彤;温福雪 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种异构网络中基于元路径的异常模体查询方法,属于网络异常查询领域。本方法针对包含多种类信息的数据提取网络,通过设定查询所需要的起始条件,找出所有满足条件的模体的集合,使用正规化的路径相似度,比较每个模体与参考模体集合之间的相似度,对其中相似度低的模体,我们认为它们是目标模体中的异常模体部分。实验结果表明,本发明提出的方法能够应用于多种异构网络上,并取得不错的效果,由于异构网络中的异常模体查询方法较少,本发明能够作为一种异构网络中的异常模体查询方法稳定使用,从而为异常模体查询提供了一种新的视角。 | ||
搜索关键词: | 一种 网络 基于 路径 异常 查询 方法 | ||
【主权项】:
1.一种异构网络中基于元路径的异常模体查询方法,其特征在于,步骤如下:步骤1)对数据集进行处理并确定查询条件1.1)根据所关注的不同节点类型构成的模体类型,从数据集中提取网络;1.2)确定节点查询条件;根据异构网络的不同节点类型,会产生不同类型的边;元路径被定义为连接两类对象的一条路径,形式化的定义写为:其中Ai表示节点类型,Ri表示关系类型;步骤2)根据步骤1.2)中给出的节点查询条件确定候选模体集合和参考模体集合,分为如下两个步骤:2.1)计算候选模体集合;对于每种类型的起始点,定义多种元路径进行查询,元路径的起始节点类型应当是起始模体中所包含的任一节点类型,元路径的结束节点类型应当是目标模体包含的节点类型中的一种;由起始模体出发,使用定义的元路径,根据起始模体的节点类型采用对应的元路径进行查询,元路径查询得到的结果是一个满足要求的点集;根据点集中节点类型的不同,从该类型节点在目标模体中所在的不同位置为起点,进行符合条件的模体的查询;对于查询到的模体,当该模体存在同构模体时,由于同一个节点在模体中的位置不同,会使得同一个模体被计算多次,因此需要将重复的模体从结果中去除;最终将产生的所有符合条件的模体存储在一个集合中,即为候选模体集合;2.2)计算参考模体集合;在步骤1.2)中,在给出候选模体查询条件的同时也会给出参考模体的查询条件,其中,当存在参考模体集合的查询条件时:由初始查询条件按照2.1)的查询步骤,得到候选模体集合和参考模体集合;当不存在参考模体集合的查询条件时:由初始查询条件按照2.1)的查询步骤,得到候选模体集合,并令参考模体集合等于候选模体集合,得到参考模体集合;步骤3)根据步骤2)中得到的候选模体集合和参考模体集合,计算候选模体集合中的每个模体和全体参考模体之间的相似度;3.1)计算每个模体到参考模体集合的相似度;借助对称元路径的概念,当两个同类型节点通过某条相同的元路径查询到了一个相同节点时,就称这条组合路径为对称路径;在查询中给出对称路径的一半,令两个起始节点均通过该元路径进行双向查询,则查询的元路径数目为:其中ma和代表候选模体,mb代表参考模体,Psym表示对称元路径,P表示组成对称元路径的一半路径,Num()函数表示路径的数目,Vab表示模体ma和模体mb中的点经由某条元路径能够走到的节点的集合,以Vab的值作为两点之间的相似度,同时有多条查询元路径的情况下,定义每种路径的不同权重,从而得到加权的相似度值;权值默认为1;3.2)计算每个模体经由对称元路径返回自身的路径数目,用于对相似度进行正规化;过程中仍需要考虑同类节点和同构因素对计算结果的影响,结果中需要统计每个节点返回自身和同模体中同类型节点的元路径数目作为对相似度进行正规化的标准,即:通过该公式计算候选模体集合和参考模体集合中每个模体到自身的路径数目,即为与自身的相似度;同样的,当存在多种元路径的情况下,且在3.1)中定义了权值,那么在该步中也要使用相同的权值进行计算;3.3)使用步骤3.2)得到的每个模体与自身的相似度作为衡量标准对步骤3.1)所得的相似度进行标准化运算;采取不同的正规化相似度进行标准化运算,包括路径相似度PathSim法和余弦相似度法;其中路径相似度PathSim法中定义模体之间的归一化路径相似度为:其中PathSim表示路径相似度;由模体间相似度的定义,得到某个模体和参考模体集合之间的相似度定义:其中mj代表标准模体集合中的任一模体,SR表示参考模体集合,Ω为总的路径相似度;步骤4)对已经标准化运算后的各个模体,根据正规划相似度进行排序,得到一个从小到大的相似度列表结果集合,用于表示和参考模体集合的相似程度,相似度列表结果集合的值越小,表示对应模体越相异于参考模体集合,反之表示对应模体与参考模体集合越相似。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910136599.4/,转载请声明来源钻瓜专利网。