[发明专利]综合行动者兴趣与网络拓扑的社区发现方法无效
申请号: | 201010225110.X | 申请日: | 2010-07-13 |
公开(公告)号: | CN101916256A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 张铭;燕飞;谭裕韦 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 北京万象新悦知识产权代理事务所(普通合伙) 11360 | 代理人: | 张肖琪 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 综合 行动 兴趣 网络 拓扑 社区 发现 方法 | ||
技术领域
本发明涉及一种Web2.0下资源共享平台中的社区挖掘,尤其是一种综合行动者兴趣与网络拓扑的社区发现方法,属于社会网络技术领域。
背景技术
社区广泛存在于人类社会中,它们有多种多样的结构形式和组织形式,如家庭、同事圈子、朋友圈子、小区、城市、甚至国家。一般来讲,一个社区(或者称作群组)是由一系列节点组成,社区内节点的相互联系相对紧密,社区间节点联系则相对稀松。近年来,随着Web2.0技术的迅猛发展,Web上出现了各种虚拟群组、在线社区等应用系统。在线社会网络系统的发展,使得大规模社会网络数据的获取成为了可能性。如何在大规模社会网络中挖掘出社区信息,成为了一个热门的研究方向,吸引了众多研究者的参与。
社区的主要功能是为具有相同兴趣的人们提供一个交流和共享的平台。一般来说,有两类社区发现的方法,第一类方法基于行动者的个人兴趣,将社区发现的问题映射为计算行动者的兴趣相似度的问题,进而将兴趣划分到不同的群组,从而得到以兴趣为中心的社区结构。例如,使用最广泛的划分聚类方法----k-means聚类法。第二类方法直接基于行动者间的联系,根据社区的定义,将社会网络划分为各个社区,形成以行动者为中心的社区结构。例如,Grivan和Newman提出了的分裂式社区发现算法,该算法通过依次移除边介(betweenness)数大的边,发现图中的社区结构。不论是基于兴趣的社区发现方法,还是基于社会联系的社区发现方法均只考虑了社区特性的一个方面。实际上,兴趣和社会联系对于社区的共享和交流功能来说都具有重要的作用。例如,社区的两个成员可能因为共同兴趣而成为朋友,成员也有可能推荐其有类似兴趣的朋友加入社区。社区和行动者社会网络是相互作用、共同发展的。
发明内容
本发明的目的在于综合社会行动者兴趣和社会网络拓扑结构,从而实现一种新的社区发现方法,该方法比起传统的社区发现算法,更加接近于真实社区的发展过程。
本发明提出的方法分为两个部分:
第一部分,基于兴趣的社区发现。首先利用聚类算法,提取行动者兴趣特征,聚类成兴趣社区。然后将根据行动者-兴趣关联信息,将行动者划分到相应的社区中,形成以兴趣为中心的社区CI。
第二部分,基于社会网络的社区扩展。首先利用行动者社会网络和行动者的兴趣,计算社会网络中边的权值。然后在这个带权社会网络中,使用带重启机制的随机游走算法,计算行动者之间的相关度。接着根据行动者间相关度和方法第一部分发现的社区,计算行动者到社区的相关度,从而将行动者加入到相关度最高的k个社区中,形成第三种结构的社区CIU。
方法的流程如图1所示,具体包括如下步骤:
A.把用户按照标注过的资源表示成标签向量(即兴趣向量)的形式;
B.对上一步产生的向量进行k-medoids聚类,产生基于兴趣的用户社区;
C.按照用户之间建立的朋友关系,计算用户社会网络边的权重,生成带权社会网络图;
D.在社会网络图上用随机游走算法,计算两个用户之间的相关度;
E.根据用户相关度和步骤B中产生的基于兴趣的社区,计算用户与社区的相关度。
本发明的有益效果:本发明提出方法逻辑比起传统的社区发现算法,更加接近于真实社区的发展过程,在有效性上有较大的提高。本发明应用于社会网络、资源共享平台,可以为信息检索系统、个性化推荐系统等服务,挖掘社区结构,利用社区特性,改进个性化服务质量。
附图说明
图1为根据本发明的综合行动者兴趣与网络拓扑的社区发现方法的总流程图;
图2为以兴趣为中心的社区结构;
图3为以行动者为中心的社区结构;
图4为本发明提出的综合社区结构;
图5为扩展社区数k对纯度的影响示意图;
图6为扩展社区数k对熵的影响示意图;
图7为随机游走重启概率a对纯度的影响示意图;
图8为随机游走重启概率a对熵的影响示意图。
具体实施方式
下面通过实例对本发明做进一步说明。需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
实例1
以下结合一个照片共享网站的例子,详细描述本发明的具体实施方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010225110.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理装置
- 下一篇:经由常规通信信道的快速物品认证