[发明专利]融合标签平均划分距离和结构关系的社区可重叠划分方法有效

专利信息
申请号: 201711187974.5 申请日: 2017-11-24
公开(公告)号: CN108090132B 公开(公告)日: 2021-05-25
发明(设计)人: 马慧芳;陈海波;赵卫中;邴睿;黄乐乐 申请(专利权)人: 西北师范大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06Q50/00
代理公司: 兰州中科华西专利代理有限公司 62002 代理人: 李艳华
地址: 730070 甘肃*** 国省代码: 甘肃;62
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 融合 标签 平均 划分 距离 结构 关系 社区 重叠 方法
【权利要求书】:

1.融合标签平均划分距离和结构关系的社区可重叠划分方法,包括以下步骤:

⑴微博数据抓取;

⑵核心标签划分:

①对标签进行扩充;

②定义标签区分度TDi,并获取TDi较大的top-l个标签作为核心标签并用作后续步骤的社区划分;

⑶基于平均划分距离的准社区划分:

ⅰ定义并计算划分熵:

给定核心标签ti∈Tcore,Tcore代表核心标签集合;设ti构成的划分为,式中代表用户集合且V={v1,v2…vn},n为用户数目,vi表示某一用户节点且vi∈V, 代表包含标签ti的用户集合,代表不包含标签ti的用户集合;

P(Ci)表示取到包含标签ti的用户集合这一事件的发生概率,则核心标签ti的划分熵定义为: ;

ⅱ定义并计算划分条件熵:

给定核心标签ti,tj∈Tcore,设ti,tj构成的划分分别为和,式中代表用户集合,代表包含标签ti的用户集合,代表不包含标签ti的用户集合,代表包含标签tj的用户集合,代表不包含标签tj的用户集合;则核心标签tj关于核心标签ti的划分条件熵定义为:;

ⅲ定义并计算划分联合熵:

给定核心标签ti,tj∈Tcore,则划分联合熵定义为:;

ⅳ定义并计算标签划分距离:

划分V/ti和划分V/tj的标签划分距离定义为:;

ⅴ求归一化标签划分距离:

划分V/ti和划分V/tj的归一化标签划分距离,即V/ti和V/tj的标签划分距离与划分联合熵的比值,定义为:;

ⅵ求标签平均划分距离:

给定核心标签ti,tj∈Tcore,则用标签ti进行划分的标签平均划分距离MPD(ti)定义为:,式中l代表核心标签集合中标签的数量;

⑷计算准社区结构相异度:

a求基于关注关系和节点度的结构相似度

由某核心标签所形成的准社区中用户节点的关注关系邻接矩阵记作A,记Aij=1表示节点i关注了节点j;初始化矩阵A对角线为数字1,记作A*,定义自己是自己本身的关注者,如果v1关注了v2,则v2是v1和v2的共同关注,v1是v1和v2的共同粉丝;

一个用户节点vi表示为Ri(attr1,attr2,attr3,attr4,attr5,attr6)的形式,其中每一维度的含义如表1所示:

表1 节点的结构属性表

用户节点的社交相似程度,其定义如下:

式中:代表节点i对节点j的关注情况,代表节点i对节点k的关注情况,代表每个被关注的节点k所赋的权值,代表节点k对节点i的关注情况,代表节点k对节点j的关注情况,代表每个关注的节点k所赋的权值,Ik代表被关注节点k的入度,Ok代表关注的节点k的出度;

b求结构相异度:

给定用户节点vi,vj∈Ck,式中Ck代表第k个社区;综合用户节点的结构属性信息,vi与vj之间的节点结构相异度DS(vi,vj)定义为:

式中:Ri和Rj分别代表不同的属性向量,T代表转置;

c计算准社区结构相异度:

给定核心标签ti划分所得的准社区Ck,则标签ti的准社区结构相异度PDS(ti)定义为:

⑸社区综合划分:

A计算综合划分相异度:

给定调节因子α,综合划分相异度CDS(ti)定义如下:

B求社区重叠度:

社区重叠度overlap(Ci,Cj)定义如下:

式中:Vi代表社区Ci中的用户集合,∩代表交运算,Vj代表社区Cj中的用户集合,min(Vi,Vj)代表社区Vi或Vj中节点最少的某个社区的节点数;

⑹执行迭代算法:

通过实验得到社区重叠度阈值,并初始化社区集合C为∅;

取t=所对应的核心标签t划分出来的准社区Ck为当前社区,并判断社区集合C,是否为∅;

如果社区集合C为∅,则将当前社区Ck加入社区集合C中;如果社区集合C不为∅,则将当前社区Ck与C中已存在的社区两两计算社区重叠度;

如果大于社区重叠度阈值,合并社区Ct与Ck;如果小于社区重叠度阈值,则将当前社区Ck加入社区集合C中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711187974.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top