[发明专利]一种基于聚类的社交网络意见领袖挖掘方法有效
申请号: | 201710729792.X | 申请日: | 2017-08-23 |
公开(公告)号: | CN107633260B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 张波;张倩;李美子;潘建国;赵勤 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵志远 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 网络 意见 领袖 挖掘 方法 | ||
1.一种基于聚类的社交网络意见领袖挖掘方法,用以获取社交网络用户中的意见领袖,其特征在于,包括以下步骤:
1)建立社交网络模型,并且获取社交网络模型中各个用户的入度、中介中心性和入度集团的集聚系数;
2)根据用户的入度、中介中心性和入度集团的集聚系数采用K-means聚类算法对用户进行聚类,在聚类结果中获取意见领袖候选用户集L;
3)计算意见领袖候选用户集L中用户的用户活跃度和用户影响力,并根据用户活跃度和用户影响力计算用户领导力,用户活跃度的计算式为:
UA(u)=α1FP'(u)+α2FF'(u)+α3FE'(u)
α1+α2+α3=1
ΔTp=Tnow-Tfirstpublish
ΔTf=Tnow-Tfirstforward
ΔTe=Tnow-Tfirstevaluate
其中,UA(u)为用户u的用户活跃度,FP(u)为用户u发布信息的频率,FF(u)为用户u转发信息的频率,FE(u)为用户u评论信息的频率,FP'(u)、FF'(u)、FE'(u)分别为FP(u)、FF(u)、FE(u)min-max标准化处理后的值,ΔTp为用户u在获取数据的时间Tnow与最早发布信息的时间Tfirstpublish之间的间隔,为用户u在ΔTp的时间内发布信息的总数,ΔTf为用户u在获取数据的时间Tnow与最早转发信息的时间Tfirstforward之间的间隔,为用户u在ΔTf的时间内转发信息的总数,ΔTe为用户u在获取数据的时间Tnow与最早评论信息的时间Tfirstevaluate之间的间隔,为用户u在ΔTe的时间内转发信息的总数,α1、α2、α3为通过层次分析分配后的权值;
4)根据用户领导力在意见领袖候选用户集L得到意见领袖。
2.根据权利要求1所述的一种基于聚类的社交网络意见领袖挖掘方法,其特征在于,所述的步骤1)中,用户的入度的计算式为:
其中,DI(u)为用户u的入度,δvu定义为当用户v是用户u的追随者时,则有δvu=1,当用户v不是用户u的追随者时,则有δvu=0,V为社交网络中的用户集合。
3.根据权利要求1所述的一种基于聚类的社交网络意见领袖挖掘方法,其特征在于,所述的步骤1)中,入度集团的集聚系数的计算式为:
其中,CI(u)为用户u的入度集团的集聚系数,n为用户u的入度集团用户总数,P为用户u的入度集团集合,M(v)为与用户v有直接边关系的用户间真实存在的有向边总数,N(v)为与用户v有直接边关系的用户总数。
4.根据权利要求1所述的一种基于聚类的社交网络意见领袖挖掘方法,其特征在于,所述的步骤1)中,用户的中介中心性的计算式为:
其中,BI(u)为用户u的中介中心性,σmn(u)为用户m和用户n之间的最短路径中经过用户u的最短路径数,σmn为用户m和用户n之间最短路径的总数,V为社交网络中的用户集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710729792.X/1.html,转载请声明来源钻瓜专利网。