[发明专利]社区发现方法有效
申请号: | 201210304097.6 | 申请日: | 2012-08-24 |
公开(公告)号: | CN102880644A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 于秦;李定伟;马立香;毛玉明 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社区 发现 方法 | ||
1.一种社区发现方法,具体包括如下步骤:
步骤1:建立一个基准特征向量和特征词库;
步骤2:提取社会网络中的用户特征词,所述社会网络可以图的形式来表示,令G=(V,E),其中,G表示一个社会网络,V表示用户v的集合,E表示用户之间边e的集合;社会网络图中的每个节点代表一个用户,每个用户的用户信息用来描述用户的属性,用户信息可以分割为多个标签,标签是用户信息的基本单位,将每个标签看成关键词,然后将各个关键词与已建立的特征词库里的特征词作比较,若该关键词存在于特征词库里,则该关键词就为特征词,反之,则不是特征词;
步骤3:建立用户特征向量,用户vi的特征向量用数学符号来表示,其中,i为用户标号,为特征向量的分量;
步骤4:计算用户相似度,根据步骤3得到用户特征向量,随机以某一个用户为基准,计算其余用户与该基准用户的相似程度,两个用户vi和vj相似度的采用如下公式得到:
其中,和分别为用户vi和vj的特征向量,特征向量中的元素个数为N,各个分向量的相似度的权重wi,(i=1,2,…,N)满足
是
其中,分别为两个用户所对应的特征向量中分向量的模,表示两个分向量的内积,ε表示一个极小值,表示全为1的向量,即
步骤5:将相似度高于相似门限值的用户记录为相似用户,把所有的相似用户合并成为一个新的用户,被合并的相似用户记录为新用户的子用户;
步骤6:重复步骤4和步骤5,直到所有用户都被划分到新用户中,若新用户达到预先设定的社区发现的门限值时,发现新的社区,该新用户内的所有子用户组成一个社区。
2.根据权利要求1所述的社区发现方法,其特征在于,步骤6中所述的发现新的社区具体过程如下:
步骤7:计算步骤6中得到的新用户对应的用户特征向量,新用户对应的用户特征向量是通过其子用户的特征向量计算得到的,该步骤分为两个部分:更新基准特征向量和计算新用户特征向量;
更新基准特征向量将所有子用户的各个分量的模相加,得到新用户各个分量的相似度权值Wm,其中,m表示新用户的标号,具体的计算公式为:p表示子用户vp,然后将所有新用户的各个分量的相似度权值Wm相加得到总相似权值W,将总权值W中最小的αN个特征分量从基准特征向量中删除,其中,α为预先设定的第一阈值,取值范围为(0 1),得到一个新的基准特征向量该基准特征向量的特征分向量的个数更改为(1-α)N。
根据更新的基准特征向量和子用户的特征向量计算新用户对应的特征向量;
步骤8:重复步骤4至步骤7,直到新用户找不到与它相似的用户或者新用户对应的基准特征向量的特征分向量的个数等于βN时,发现新社区,其中,β为预先设定的第二阈值,取值范围为(0 1),该新用户下的所有子用户都是所述新社区的成员,将所述新社区对应的特征分向量作为关键词添加到新社区的属性标签里,当所有社区发现完时,将基准特征向量还原到初始状态,基准特征向量的特征分向量个数为N;
步骤9:简化社会网络。
简化所有用户的特征向量,为每个用户生成一个其对应的新的特征向量所述特征向量的每个分量是数字“1”或“0”,分量个数为N,若用户特征向量的分向量中有用户信息的特征词,则相应的分量值为“1”,反之则为“0”;
为每个社区生成其对应的社区特征向量所述特征向量的每个分量与的中的每个分量是一一对应的,每个分量是数字“1”或“0”,分量个数为N,从社区的标签中提取特征词,将社区特征词对应的分量用“1”表示,其余的都用“0”表示;
一一计算某个用户与其所属社区外的所有社区的相似度,对于某个社区,若计算得到的相似度小于预先设定的第三阈值,则去除所述用户与所述社区内所有用户的连接,将所有用户遍历一次,则得到一个精简社会网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210304097.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络配置处理方法、装置和无线网络控制器
- 下一篇:混合动力车辆