[发明专利]一种基于聚类的社交网络意见领袖挖掘方法有效

专利信息
申请号: 201710729792.X 申请日: 2017-08-23
公开(公告)号: CN107633260B 公开(公告)日: 2020-10-16
发明(设计)人: 张波;张倩;李美子;潘建国;赵勤 申请(专利权)人: 上海师范大学
主分类号: G06K9/62 分类号: G06K9/62;G06Q50/00
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 赵志远
地址: 200234 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 社交 网络 意见 领袖 挖掘 方法
【权利要求书】:

1.一种基于聚类的社交网络意见领袖挖掘方法,用以获取社交网络用户中的意见领袖,其特征在于,包括以下步骤:

1)建立社交网络模型,并且获取社交网络模型中各个用户的入度、中介中心性和入度集团的集聚系数;

2)根据用户的入度、中介中心性和入度集团的集聚系数采用K-means聚类算法对用户进行聚类,在聚类结果中获取意见领袖候选用户集L;

3)计算意见领袖候选用户集L中用户的用户活跃度和用户影响力,并根据用户活跃度和用户影响力计算用户领导力,用户活跃度的计算式为:

UA(u)=α1FP'(u)+α2FF'(u)+α3FE'(u)

α123=1

ΔTp=Tnow-Tfirstpublish

ΔTf=Tnow-Tfirstforward

ΔTe=Tnow-Tfirstevaluate

其中,UA(u)为用户u的用户活跃度,FP(u)为用户u发布信息的频率,FF(u)为用户u转发信息的频率,FE(u)为用户u评论信息的频率,FP'(u)、FF'(u)、FE'(u)分别为FP(u)、FF(u)、FE(u)min-max标准化处理后的值,ΔTp为用户u在获取数据的时间Tnow与最早发布信息的时间Tfirstpublish之间的间隔,为用户u在ΔTp的时间内发布信息的总数,ΔTf为用户u在获取数据的时间Tnow与最早转发信息的时间Tfirstforward之间的间隔,为用户u在ΔTf的时间内转发信息的总数,ΔTe为用户u在获取数据的时间Tnow与最早评论信息的时间Tfirstevaluate之间的间隔,为用户u在ΔTe的时间内转发信息的总数,α1、α2、α3为通过层次分析分配后的权值;

4)根据用户领导力在意见领袖候选用户集L得到意见领袖。

2.根据权利要求1所述的一种基于聚类的社交网络意见领袖挖掘方法,其特征在于,所述的步骤1)中,用户的入度的计算式为:

其中,DI(u)为用户u的入度,δvu定义为当用户v是用户u的追随者时,则有δvu=1,当用户v不是用户u的追随者时,则有δvu=0,V为社交网络中的用户集合。

3.根据权利要求1所述的一种基于聚类的社交网络意见领袖挖掘方法,其特征在于,所述的步骤1)中,入度集团的集聚系数的计算式为:

其中,CI(u)为用户u的入度集团的集聚系数,n为用户u的入度集团用户总数,P为用户u的入度集团集合,M(v)为与用户v有直接边关系的用户间真实存在的有向边总数,N(v)为与用户v有直接边关系的用户总数。

4.根据权利要求1所述的一种基于聚类的社交网络意见领袖挖掘方法,其特征在于,所述的步骤1)中,用户的中介中心性的计算式为:

其中,BI(u)为用户u的中介中心性,σmn(u)为用户m和用户n之间的最短路径中经过用户u的最短路径数,σmn为用户m和用户n之间最短路径的总数,V为社交网络中的用户集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710729792.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top