[发明专利]融合标签平均划分距离和结构关系的社区可重叠划分方法有效
申请号: | 201711187974.5 | 申请日: | 2017-11-24 |
公开(公告)号: | CN108090132B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 马慧芳;陈海波;赵卫中;邴睿;黄乐乐 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 兰州中科华西专利代理有限公司 62002 | 代理人: | 李艳华 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 标签 平均 划分 距离 结构 关系 社区 重叠 方法 | ||
本发明涉及一种融合标签平均划分距离和结构关系的社区可重叠划分方法,该方法包括以下步骤:⑴微博数据抓取;⑵核心标签划分:①对标签进行扩充;②定义标签区分度TDi,并获取TDi较大的top‑l个标签作为核心标签并用作后续步骤的社区划分;⑶基于平均划分距离的准社区划分;⑷计算准社区结构相异度:a求基于关注关系和节点度的结构相似度;b求结构相异度;c计算准社区结构相异度;⑸社区综合划分:A计算综合划分相异度;B求社区重叠度;⑹执行迭代算法。本发明综合考虑平均划分距离与结构相异度之间的关系,给定参数进行调节,得到综合划分相异度,选取综合划分相异度最小的标签划分形成的簇作为当前社区划分的结果并输出,使得划分合理准确。
技术领域
本发明涉及社交网络分析领域,尤其涉及融合标签平均划分距离和结构关系的社区可重叠划分方法。
背景技术
作为一种主流的社交媒体,微博拥有着数以亿计的用户群体,并与日常生活关联越来越密切。微博凭借其独特的传播形式、开放性、简洁性和低门槛等特性,渐渐成为人们获取信息、人际交往、社会分享以及产品推广的重要媒介和平台。作为一种复杂的社交网络,微博中存在着一种类社区型的结构,这种结构的特点是网络内部存在节点连接紧密的社区,而社区之间连接比较松散。因此对微博用户社区的划分有着重要的理论和现实意义。
国内外对于社区发现的研究比较多,在考虑一个节点是不是可以包含在两个以上社区中,可以将社区发现分为可重叠的社区发现和不可重叠的社区发现。对于不可重叠社区发现,基于模块度最优思想的凝聚类算法成为目前网络社区挖掘方法的主流,经典算法包括Fast-Newman算法等。另外基于标签传播的社区识别经典算法是未考虑重叠社区检测的硬聚类算法RAK。基于相似度的社区发现方法如相似度模块化函数方法在用户关注关系基础上加入了用户标签概念,但此方法并没有考虑到用户标签过少的情况且算法不可重叠。
随着网络结构的日益复杂化,社区结构中开始出现彼此包含的关系,因此可重叠社区的研究方面是近年来研究的热点,有关社区发现的大部分研究也都是基于重叠社区的。可重叠社区发现方法有基于核心标签的可重叠划分方法,该方法通过定义划分质量函数可以很好地控制社区重叠度,但是社交关系的结合较为单一,且对标签用作划分依据时所产生的信息关注不够,因此划分准确度存在局限。
DC-DTM算法将影响力大的用户节点作为初始节点,标签按照节点的影响力从大到小进行传播,避免了传统标签传播算法逆流现象的发生,提高了标签传播算法的稳定性,但是对于社区结构的关注度不足。基于非负矩阵的半监督社区划分方法,该方法利用了标签的先验知识进行训练,在划分中归并标签,在重叠社区发现任务上具有良好的解释性,但是划分的准确性取决于先验知识的的获取,该模式无法脱离半监督的先决条件,因此在实际应用中存在局限。此外还有一种基于马尔可夫动态展开和提取重叠社区算法(UEOC)来进行复杂网络的社区检测,实验结果表明UEOC是有效的,但是在处理诸如WWW、Internet等大型网络时,仍然缺乏准确挖掘潜在视角的能力。
发明内容
本发明所要解决的技术问题是提供一种划分合理准确的融合标签平均划分距离和结构关系的社区可重叠划分方法。
为解决上述问题,本发明所述的融合标签平均划分距离和结构关系的社区可重叠划分方法,包括以下步骤:
⑴微博数据抓取;
⑵核心标签划分:
①对标签进行扩充;
②定义标签区分度TDi,并获取TDi较大的top-l个标签作为核心标签并用作后续步骤的社区划分;
⑶基于平均划分距离的准社区划分:
ⅰ定义并计算划分熵:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711187974.5/2.html,转载请声明来源钻瓜专利网。