[发明专利]一种电子邮件网络的社区结构发现方法及系统在审

专利信息
申请号: 202010469233.1 申请日: 2020-05-28
公开(公告)号: CN111726279A 公开(公告)日: 2020-09-29
发明(设计)人: 杜航原 申请(专利权)人: 山西大学
主分类号: H04L12/58 分类号: H04L12/58;H04L12/24;G06Q50/00
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 张仲波
地址: 030091*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电子邮件 网络 社区 结构 发现 方法 系统
【说明书】:

发明公开了一种电子邮件网络的社区结构发现方法及系统,属于Web网络数据挖掘领域,用于解决电子邮件网络中的社区发现问题;该方法包括:基于电子邮件数据集进行电子邮件网络拓扑建模;对电子邮件网络中的每个用户的社区标签进行多次随机初始化,并利用标签传播方法生成电子邮件网络的多个独立社区发现结果;计算每一独立社区发现结果的模块度;计算各独立社区发现结果的集成权重;将电子邮件网络的多个独立社区发现结果进行加权集成,获得电子邮件网络的集成社区发现结果。本发明具有算法结构简单、易于实现,以及执行效率较高的优点,通过对多个独立的社区发现结果进行一致性集成,能够获得稳定性和可靠性较高的电子邮件网络社区发现结果。

技术领域

本发明涉及Web网络数据挖掘技术领域,特别涉及一种电子邮件网络的社区结构发现方法及系统。

背景技术

电子邮件是通过使用电子手段进行信息交换的通信方式,它的出现极大地方便了人们之间的沟通与交流,也是目前使用频率较高的一种网络通信方式。电子邮件能够在很大程度上对真实社会中人们的通信关系进行体现,因此由大量电子邮件的发送者和接收者构成的网络是社会网络的组成之一,可以借鉴社会网络分析手段对其进行分析处理。电子邮件网络通常处于内部通信和动态通信的行为模式中,与其他社会网络类似,其中包含着若干社区结构,这些社区结构内部往往存在着密切的通信关系,而不同社区结构之间通信较少。从电子邮件网络动态组织的层级关系结构中快速准确地发现潜在社区结构,可以揭示现实社会的组织和运行模式,使人们更加清楚的了解信息的传播路径和方式,掌握信息的传播规律,进行信息的定向定点投放,以及进行个性化服务推荐,具有重要的研究意义和实用价值。

从目前的研究成果和技术应用情况来看,社区发现方法主要分为四种类型:(1)基于层次聚类的社区发现方法,通过度量网络节点间的相似度,进而将相似度较大的节点归为同一社区,将相似度较小的节点置于不同社区,根据其网络节点的聚类规则可分为凝聚式和分裂式两类方法;(2)基于优化模型的社区发现方法,模拟一个物理系统到达均衡状态的过程,定义一个目标函数度量社区划分结果的优劣,在搜索空间中寻找使目标函数取得最优值的划分结果,其中最典型的度量函数是模块度;(3)基于图分割的社区发现方法以及启发式方法.其基本思想是根据网络Laplacian矩阵的特征向量分量对网络节点间的相似性进行度量,并利用其可以在任意形状样本空间上实现聚类的优点对网络社区进行划分;(4)以直观或经验构造为基础的启发式方法也对社区发现问题的研究产生了积极意义,比较有代表性的方法主要包括标签传播算法、基于距离或吸引力的算法以及群智能算法等。

电子邮件网络作为社会网络领域中的重要研究对象之一,具有与社会网络类似的许多特性,同时也存在一些鲜明的特点,例如数据规模巨大、存在无效垃圾邮件、数据类型化等。这些特点对社区发现方法的执行效率和鲁棒性都提出了较高要求,并可能导致传统的社区发现方法在电子邮件网络中难以取得令人满意的效果。因此,为电子邮件网络设计高效可靠的社区发现方法是一个意义重大并且极具挑战的技术问题。

发明内容

本发明提供了一种电子邮件网络的社区结构发现方法及系统,以解决传统的社区发现方法在电子邮件网络中难以取得令人满意效果的技术问题。

为解决上述技术问题,本发明提供了如下技术方案:

一方面,本发明提供了一种电子邮件网络的社区结构发现方法,包括:

基于预设电子邮件数据集进行电子邮件网络拓扑建模,构建电子邮件网络;

对构建的电子邮件网络中的每个用户的社区标签进行多次随机初始化,并利用标签传播方法生成电子邮件网络的多个独立社区发现结果;

计算每一独立社区发现结果的模块度,以评价各独立社区发现结果的质量;

基于各独立社区发现结果的模块度,计算各独立社区发现结果的集成权重;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010469233.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top