[发明专利]综合行动者兴趣与网络拓扑的社区发现方法无效
申请号: | 201010225110.X | 申请日: | 2010-07-13 |
公开(公告)号: | CN101916256A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 张铭;燕飞;谭裕韦 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 北京万象新悦知识产权代理事务所(普通合伙) 11360 | 代理人: | 张肖琪 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 综合 行动 兴趣 网络 拓扑 社区 发现 方法 | ||
1.一种Web社区发现方法,应用于社会网络和资源共享平台,其特征在于,所述方法综合了社会行动者兴趣和社会网络拓扑结构,包括以下步骤:
A.把用户按照标注过的资源表示成标签向量的形式;
B.对上一步产生的向量进行k-medoids聚类,产生基于兴趣的用户社区;
C.按照用户之间建立的朋友关系,计算用户社会网络边的权重,生成带权社会网络图;
D.在社会网络图上用随机游走算法,计算两个用户之间的相关度;
E.根据用户相关度和步骤B中产生的基于兴趣的社区,计算用户与社区的相关度。
2.如权利要求1所述的方法,其特征在于,所述步骤B中的k-medoids聚类方法流程如下:
1)随机挑选k个点作为质心;
2)对每个点计算该点到每个社区中心的距离,把该点加入与它距离最近的社区;
3)重新计算每个社区的中心,中心向量定义为社区内所有点的向量平均值;
4)重新计算每个点到所属中心的距离,选离中心最近的点作为社区中心;
5)重复2)、3)、4)三个步骤,直到每个社区内的点不再变化。
3.如权利要求2所述的方法,其特征在于,所述步骤C中计算用户社会网络边的权重的方法如下:
设行动者ui拥有的资源集合为Ri,行动者uj拥有的资源集合为Rj,同时ui到uj存在边eij,那么边eij的权值为:
4.如权利要求3所述的方法,其特征在于,所述步骤D中的随机游走算法采用公式p(t+1)=(1-a)Sp(t)+aq,其中p(t)和q为列向量,pi(t)表示第t步时到达点i的概率,pi(0)表示从目标行动者出发,q表示初始状态,元素qi表示初始时在结点i的概率,S是转移概率矩阵,Sij是当前在点i,下一步达到结点j的概率;起始点在q中的初始概率设为1,其它点的概率设置为0。
5.如权利要求4所述的方法,其特征在于,所述步骤D的实现方法为:
对社会网络中每一个结点,从该结点出发,使用带重启机制的随机游走算法进行计算,直至算法收敛,从而得到目标结点到网络中其它结点的相关度。
6.如权利要求5所述的方法,其特征在于,所述步骤E中计算用户与社区相关度的方法为:
对于一个用户ui,和一个社区Ck,用户到社区的相关度按如下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010225110.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理装置
- 下一篇:经由常规通信信道的快速物品认证