[发明专利]社交网络中基于节点间相似性的重叠社区检测方法及系统有效
申请号: | 201710393283.4 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107153713B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 丁帅;牛锋;杨善林;孙晓;范雯娟;胡世康;王浩 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 王莹 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 基于 节点 相似性 重叠 社区 检测 方法 系统 | ||
技术领域
本发明涉及网络数据处理技术领域,尤其涉及一种社交网络中基于节点间相似性的重叠社区检测方法及系统。
背景技术
现实世界中存在的许多复杂系统大多可以用复杂网络进行描述。例如:新陈代谢网,蛋白质交互网,基因网络,科学家合著网络,电力网,航空网以及社交网络等等。一直以来人们对于复杂网络的研究从未间断,近些年来,由于互联网的快速发展使得人们越来越关注复杂网络,尤其是社交网络,并进行了大量的研究工作。
一般而言,复杂网络由于自身内部结构较为复杂,直接对整个网络进行研究是一件十分困难的事,因此人们一般通过研究网络的社区结构从而更好地理解整个网络。所谓社区,是节点的集合,在社区内部节点连接很紧密,但是属于不同社区的节点连接则比较稀疏。社区结构普遍存在于复杂网络中,社交网络作为复杂网络的一类也已被证明网络内部具有社区结构,很多用于复杂网络的社区发现算法也可用于社交网络。
现有的关于社区发现问题的处理方法主要分为了以下三类。一为基于节点连边的方式,即通过提取网络中节点之间的连边,将社区发现问题转化为图论等问题进行处理。此类方法没有考虑到社交网络中环境中节点所具有的属性信息和潜在的兴趣特征。一为基于节点内容的方式,通过提取网络中节点的自身属性信息和潜在的兴趣特征,将社区发现问题转化为节点聚类等问题进行处理。此类方法忽略了网络中极为重要的结构拓扑信息。还有一种综合方法,将网络结构与节点信息相结合,分别基于网络结构和节点信息对同一网络进行社区发现,从而得到两种不同的社区结构,在此基础之上使用一些特定的方法将两种社区进行融合,最终得到结构与内容双内聚的社区。此类方法需要进行两次的社区发现,在规模较大的社交网络中,其算法的效率较低。
发明内容
基于上述问题,本发明提供一种社交网络中基于节点间相似性的重叠社区检测方法及系统,在社交网络环境中融合了网络结构信息与节点属性信息的相似性计算方法,然后在此基础之上提出了融合节点相似性的重叠社区发现算法,以得到网络结构与节点偏好双内聚的高质量社区。
为解决上述问题,本发明提供了一种社交网络中基于节点间相似性的重叠社区检测方法,具体包括:
S1、接收待检测的社交网络;
S2、计算待检测社交网络中节点间的相似程度;
S3、基于节点间的相似程度,检测社交网络的重叠社区;
S4、输出检测的重叠社区的结构。
其中,计算所述待检测社交网络中节点间的相似程度,具体包括:
根据节点的邻居节点计算社交相似度,得到节点间的社交相似度;
根据节点的属性计算属性相似度,得到节点间的属性相似度;
根据所述社交相似度与所述节点间的属性相似度,得到所述社交网络中节点间的相似程度。
其中,根据节点的属性计算属性相似度,得到节点间的属性相似度,具体包括:
判断节点的属性是离散型属性还是文本型属性;
当节点的属性为离散型属性时,节点间的属性相似度为两个节点的属性是否相等,是则判定两个节点的属性相似;
当节点的属性为文本型属性时,计算节点间的属性相似度具体如下:
输入节点的文本属性值;
运用字符匹配的方式对属性文本进行分词处理,并对分词后的词组进行词性标注;
将分词处理后的属性文本进行去除停用词处理;
对去除停用词处理后的属性文本进行关键词提取,得到节点的关键词;
构建节点-关键词矩阵;
基于节点-关键词矩阵,计算节点间的关键词相似度作为节点间的属性相似度。
其中,基于所述节点间的相似程度,检测所述社交网络的重叠社区,具体包括:
根据所述节点间的相似程度,计算所述社交网络中的每个节点的相似势,所述节点的相似势为该节点在节点相似度中的相似影响力;
根据所述每个节点的相似势,设定所述社交网络的局部高势点,并将所述局部高势点作为粗糙聚类的初始聚类中心;
根据所述粗糙聚类的初始聚类中心,对所述社交网络的节点进行粗糙K-Mediods聚类,得到社交网络的初始重叠社区结构;
通过社区合并的方式对所述初始重叠社区结构进行优化;
输出最优重叠社区结构。
其中,根据所述每个节点的相似势,设定所述社交网络的局部高势点,并将所述局部高势点作为粗糙聚类的初始聚类中心,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710393283.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种合金用的熔炼系统
- 下一篇:基于环流场异型风道除霾装置及其制造方法