[发明专利]融合标签平均划分距离和结构关系的社区可重叠划分方法有效
申请号: | 201711187974.5 | 申请日: | 2017-11-24 |
公开(公告)号: | CN108090132B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 马慧芳;陈海波;赵卫中;邴睿;黄乐乐 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 兰州中科华西专利代理有限公司 62002 | 代理人: | 李艳华 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 标签 平均 划分 距离 结构 关系 社区 重叠 方法 | ||
1.融合标签平均划分距离和结构关系的社区可重叠划分方法,包括以下步骤:
⑴微博数据抓取;
⑵核心标签划分:
①对标签进行扩充;
②定义标签区分度TDi,并获取TDi较大的top-l个标签作为核心标签并用作后续步骤的社区划分;
⑶基于平均划分距离的准社区划分:
ⅰ定义并计算划分熵:
给定核心标签
P(Ci)表示取到包含标签
ⅱ定义并计算划分条件熵:
给定核心标签
ⅲ定义并计算划分联合熵:
给定核心标签
ⅳ定义并计算标签划分距离:
划分V
ⅴ求归一化标签划分距离:
划分V
ⅵ求标签平均划分距离:
给定核心标签
⑷计算准社区结构相异度:
a求基于关注关系和节点度的结构相似度
由某核心标签所形成的准社区中用户节点的关注关系邻接矩阵记作A,记A
一个用户节点v
表1 节点的结构属性表
用户节点的社交相似程度,其定义如下:
式中:代表节点
b求结构相异度:
给定用户节点
式中:R
c计算准社区结构相异度:
给定核心标签
;
⑸社区综合划分:
A计算综合划分相异度:
给定调节因子
;
B求社区重叠度:
社区重叠度overlap(C
式中:V
⑹执行迭代算法:
通过实验得到社区重叠度阈值,并初始化社区集合C为∅;
取t=所对应的核心标签t划分出来的准社区C
如果社区集合C为∅,则将当前社区C
如果大于社区重叠度阈值,合并社区C
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711187974.5/1.html,转载请声明来源钻瓜专利网。