[发明专利]一种基于双视图的自适应两级加权目标社区发现及检测方法在审
申请号: | 201911111006.5 | 申请日: | 2019-11-14 |
公开(公告)号: | CN111026919A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 马慧芳;刘海姣;李志欣 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06Q50/00 |
代理公司: | 北京翔石知识产权代理事务所(普通合伙) 11816 | 代理人: | 李勇 |
地址: | 730071 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视图 自适应 两级 加权 目标 社区 发现 检测 方法 | ||
本发明提供一种基于双视图的自适应两级加权目标社区发现及检测方法,包括如下步骤:基于用户提供的样例节点,建立有限节点序列的候选节点替换路径以组成社区主干,根据该社区主干推断用户偏好;利用网络的属性和结构两类信息,构建社区主干的属性视图和结构视图以双视图表示,并设计了一种自适应的两级加权目标社区核心检测方法,用于计算每个目标社区在两个视图以及对应视图下单个变量的权重;基于社区的内部连通性和外部可分离性定义目标社区的质量评分,挖掘得到高质量的目标社区。本发明有效地挖掘用户偏好信息,同时利用节点属性和结构信息挖掘高质量的目标社区,进而提高目标社区发现精度,还适用于大规模复杂网络中的目标社区的提取。
技术领域
本发明属于复杂网络分析领域,具体而言,涉及一种新型的目标社区发现及检测方法。
背景技术
现实世界中事物与事物之间是密切联系的,普遍存在的联系将大部分事物映射成一个个复杂系统,这些系统往往能表示为图或网络的形式,其中节点表示数据对象,边表示数据对象之间的关系。已有研究发现:现实世界的网络中存在明显“社区”特性,即社区结构满足社区内连接尽可能稠密、社区间连接尽可能稀疏。网络中社区结构识别对于理解网络功能、发现网络中隐藏规律以及预测网络中个体行为具有重要的理论和现实意义,已逐渐成为当今复杂网络分析领域的研究热点,研究成果被广泛应用于恐怖组织识别、用户兴趣分析和商品推荐、Web文档聚类、生物分子功能团识别等众多领域。事实上,现实世界网络中节点间除了存在连接关系外,节点往往可由描述其特征的属性信息刻画。以Web2.0时代下的Web交互平台(微博、微信、Twitter、Facebook、Flickr、优酷、YouTube等)为例,其除了由个体间关系构成社交网络(用户关系、微博转发评论关系、图片共享关系、视频共同共观看关系等数据),个体还可以基于自身特性描述(用户兴趣、微博/微信文本、图像标签、视频主题/标签/评论等)。此外,大多数社区发现研究都是以获取全局网络的所有信息为前提,这在实践中难以满足。面向此类网络(属性网络或属性图)的目标社区发现的主要目标是充分挖掘用户给定的先验样例节点从而定位与用户偏好密切相关的目标社区,即社区内不仅节点间连接关系稠密、节点在特定的子空间下属性相似性也较大且与样例节点尽可能相似。属性网络或属性图目标社区发现有益于充分利用异构数据信息间的互补特性,常具有更好的挖掘效果。
针对属性网络的社区发现方法已经得到了广泛的研究,然而,现有的大多数方法未能面向用户定位基于用户偏好的目标社区。因此,在属性网络中如何基于用户给定的样例信息挖掘与用户兴趣相关的内部一致且与外部分离良好的高影响力目标社区显得尤为重要。少数研究人员通过对已有社区发现方法改进,在一定程度上实现目标社区发现并提升目标社区质量,但是现有算法的局限性使得基于用户兴趣的目标社区发现任务面临严峻挑战,如何同时利用节点间的连接关系和节点属性信息进行更有效的目标社区挖掘是一个重要的研究问题。
具体而言,结合节点属性及结构信息,利用用户给定的先验信息挖掘用户偏好信息;同时目标社区必须遵从社区的内部紧密且与外部分离良好的内在特征,保证社区质量;而且特定应用决定了社区质量与外部影响力具有内在关联性。已有研究表明,现实社会中人们更关注于自身质量较高且具有一定的向外传播信息能力的社区,导致社区内部质量与外部影响力的相关性成为研究瓶颈。
发明内容
本发明的目的在于提供一种基于双视图的自适应两级加权目标社区发现及检测方法(Adaptive Two-level weighted target Communities detection with DoubleViews,ATV-DV),综合考虑网络中节点的属性信息与结构信息的关联性特征,能够基于用户偏好,利用网络中的局部信息,快读、精确地发现网络中的目标社区。
本发明提出如下的技术方案,一种基于双视图的自适应两级加权目标社区发现及检测方法,包括如下步骤:
步骤1,获取用户给定的样例节点,融合节点属性及其邻居量化节点质量;寻找样例节点替换路径,解决样例节点质量依赖,利用样例节点替换路径及其邻居,挖掘路径所在的社区主干;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911111006.5/2.html,转载请声明来源钻瓜专利网。