[发明专利]基于核心群体挖掘和意见领袖识别结果的分群方法及系统有效
申请号: | 201910031966.4 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109828998B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 殷复莲;刘晓薇;邵雪莹;吴佳乐;王颜颜 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06Q50/00 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张超艳;杨桦 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 核心 群体 挖掘 意见 领袖 识别 结果 分群 方法 系统 | ||
本发明提供一种基于核心群体挖掘和意见领袖识别结果的分群方法及系统,包括:传播网络用户分为意见领袖、去交集核心群体和其他用户;构建分层传播网络模型,节点为上述三类中的用户,用户之间传播行为作为对应节点之间的路径;通过传播行为发生的次数获得中间层和底层的用户的不同传播方向的不同综合指标值,构建去交集核心群体‑综合指标数值表及其他用户‑综合指标数值表;将意见领袖分为可信意见领袖和不可信意见领袖;将去交集核心群体、其他用户内用户分别按照去交集核心群体‑综合指标数值表和其他用户‑综合指标数值表进行分群。上述方法及系统充分运用核心群体挖掘的结果和意见领袖识别的结果实现基于事件参与程度的用户分级。
技术领域
本发明涉及数据挖掘技术领域和社交网络分析领域,更为具体地,涉及一种基于核心群体挖掘和意见领袖识别结果的分群方法及系统。
背景技术
如今,新浪微博拥有大量活跃的用户、丰富的言论,使得基于新浪微博数据展开的社交网络分析愈发重要。也正是由于用户参与量的激增,如何衡量众多用户的参与程度并进行等级的划分,对平台监管与事件重点监测都具有实际应用的意义。在现有的研究中,不论是在社区分群结果中挖掘核心群体,还是在传播网络中识别意见领袖,都已经存在了许多相关的研究以及改进方法。然而,针对热点事件所形成的传播网络进行参与人群分类的研究却十分少见。目前,参与人群分类更多情况下作为意见领袖的附属研究出现,如在识别出意见领袖后,将参与人群分为意见领袖、促进者、参与者、追随者、沉默者五个类别。因此研究如何对传播网络中的参与人群进行细致地划分,是十分有必要的。
发明内容
鉴于上述问题,本发明的目的是提供一种充分运用核心群体挖掘的结果和意见领袖识别的结果,对社交网络热点事件的参与用户进行分类,实现基于事件参与程度的用户分级的基于核心群体挖掘和意见领袖识别结果的分群方法及系统。
根据本发明的一个方面,提供一种基于核心群体挖掘和意见领袖识别结果的分群方法,包括:
将传播网络中的所有用户分为三个类别,第一类别为意见领袖识别结果中的意见领袖,第二类别为核心群体挖掘结果的核心群体中去除与意见领袖有交集的用户后的去交集核心群体,第三类别为所有用户中去除第一类别和第二类别后的其他用户;
根据上述三个类别构建分层传播网络模型,其中,顶层的节点为第一类别的意见领袖中的用户,中间层的节点为第二类别的去交集核心群体中的用户,底层的节点为其他用户的用户,用户之间传播行为发生的次数作为对应节点之间的路径;
通过传播行为发生的次数根据下式(1)至(3)获得中间层和底层的用户的不同传播方向的不同综合指标值,构建去交集核心群体-综合指标数值表及其综合指标值构建其他用户-综合指标数值表,
其中,a、b为传播网络层数的索引,u为a层的一个用户,na为a层的用户总数,u′为b层的一个用户,a-b为传播方向,为用户u与用户u′之间在传播方向a-b上的传播行为,为a层用户u的综合指标数值,其中,顶层的意识领袖的综合指标数值为已知;
将意见领袖分为可信意见领袖和不可信意见领袖;
将去交集核心群体、其他用户内用户分别按照去交集核心群体-综合指标数值表和其他用户-综合指标数值表进行分群。
优选地,所述传播网络的传播方向包括:从顶层用户向中间层用户的传播,中间层用户之间的传播,从中间层用户向底层用户的传播,从顶层用户向底层用户传播以及底层用户之间的传播。
进一步,优选地,按照传播方向分层次对不同层的用户的综合指标数值进行更新,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910031966.4/2.html,转载请声明来源钻瓜专利网。