[发明专利]一种ego网络社交圈子识别方法有效

专利信息
申请号: 201910507062.4 申请日: 2019-06-12
公开(公告)号: CN110347933B 公开(公告)日: 2022-04-22
发明(设计)人: 王晨旭;郝崇孝;管晓宏 申请(专利权)人: 西安交通大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06Q50/00
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 安彦彦
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 ego 网络 社交 圈子 识别 方法
【权利要求书】:

1.一种ego网络社交圈子识别方法,其特征在于,包括如下步骤:

步骤1:构建用户的ego网络:将用户抽象成ego网络中的一个节点,用户之间的关系抽象成ego网络中的一条边;

步骤2:结合ego网络结构信息和节点属性信息来建模边之间的相似性;其中,边之间的相似性采用相似度S进行判断,相似度S的定义如下:

S=a×Ss+(1-a)×SA

其中,Ss是结构相似度,SA是属性相似度,a是结构相似度和属性相似度之间的权衡系数;

两条边eik和ejk的结构相似度Ss定义如下:

两条边eik和ejk的属性相似度SA定义如下:

A(eij)=A(i)∪A(j)

其中,A(i)是节点i的属性集,A(j)是节点j的属性集;

步骤3:初始化每条边作为一个社交圈子,然后根据社交圈子之间的相似度采用层次聚类方法进行聚类,得到树状图;

步骤4:选取阈值截取树状图,获得边社交圈子,并将边社交圈子转化为节点社交圈子;其中,采用基于分区密度的方法选取阈值截取树状图,或采用基于相似度分布的方法选取阈值截取树状图;采用基于分区密度的方法选取阈值截取树状图的具体过程为:根据树状图,计算每个层次对应的边社交圈子划分所具有的分区密度,选择最大的分区密度值所对应的边社交圈子作为最终的结果,并将边社交圈子转换为节点社交圈子;其中,分区密度定义D如下:

其中,M表示所有边的数量,mc表示社交圈子c中的边的数量,Dc是社交圈子c的边密度,Dc定义如下:

nc表示社交圈子c的节点数量;

采用基于相似度分布的方法选取阈值截取树状图的具体过程为:首先,将相似度划分为具有相等长度的N个间隔,并计算落在每个间隔中的相似度值的数量,然后将相似度值作为水平x轴,将相似度值的数量作为垂直y轴,用一个多项式拟合相似度的经验分布:

其中,n≥3,是要估计的参数,间隔的中心是x1,x2,...,xN,并且间隔中的计数分别是y1,y2,...,yN;对于每个n,采用多项式最小化真实值和预测值之间的残差平方和:

然后,利用均方误差MSE评估拟合多项式,选择具有最小MSE的阶数为n*的多项式作为拟合曲线;均方误差MSE定义如下:

其中,是第i个例子的预测值,yi是对应的真实值;最后,通过求解下面的等式计算拟合曲线的拐点:

将阈值设置为满足上面的等式的最小x;

步骤5:提取节点社交圈子的属性特征和结构特征,然后训练分类器来识别社交圈子的种类;

首先,用Facebook和Google+数据集手动的标记社交圈子的种类lc,然后,对于每一个社交圈子,提取它的网络结构特征和属性特征并组成一个特征向量p是特征的数量,xi是第i个特征的值;每个训练实例包括特征向量和对应的圈子种类lc;然后采用分类方法对获得的社交圈子进行分类;分类方法包括朴素贝叶斯、支持向量机、AdaBoost算法和GradientBoosting算法。

2.根据权利要求1所述的一种ego网络社交圈子识别方法,其特征在于:步骤1)中ego网络的定义如下:

在ego网络中,节点由一个中心节点ego以及这个节点的邻居节点alters组成,边包括中心节点ego和邻居节点alters之间的边以及邻居节点alters和邻居节点alters之间的边。

3.根据权利要求1所述的一种ego网络社交圈子识别方法,其特征在于:步骤3)的具体过程为:初始时,将每条边都看作是一个单独的边社交圈子;然后,每次合并时,选择相似度最大的两个社交圈子来进行合并;重复合并过程直到合并为一个边社交圈子为止,得到层次聚类算法对应的树状图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910507062.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top