[发明专利]话题领域中社交网络关键节点的识别方法有效
申请号: | 201610364264.4 | 申请日: | 2016-05-27 |
公开(公告)号: | CN106055627B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 杨力;田亚平;王小琴;马建峰;张俊伟;张冬冬;王利军 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06Q50/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种话题领域中社交网络关键节点的识别方法,克服现有技术中没有考虑到真实社交网络中用户节点对于信息传播的影响因素以及计算复杂性较高的问题。其实现步骤是:(1)构建网络的有向图;(2)生成与有向图对应的邻接矩阵;(3)量化用户节点对信息传播的影响因素;(4)量化用户节点的话题topic相关度;(5)量化用户节点信息传播能力;(6)识别关键节点。本发明提出的方法依赖于网络的本地拓扑结构,引入了实际社交网络中用户节点对于信息传播影响因素及用户话题相关度的概念,降低了计算的复杂性,可以有效地识别出话题领域中社交网络关键节点。 | ||
搜索关键词: | 话题 域中 社交 网络 关键 节点 识别 方法 | ||
【主权项】:
1.一种话题领域中社交网络关键节点的识别方法,具体步骤如下:(1)构建网络的有向图:将待识别的社交网络映射成有向图G(V,E),其中,V表示社交网络用户节点集合,E表示社交网络用户节点间的交互关系集合;(2)采用网络邻接矩阵的生成方法,生成与有向图对应的邻接矩阵;(3)量化用户节点对信息传播的影响因素:(3a)搜集用户发布的信息,按照下式,量化影响信息传播的用户节点信息发布的活跃度:
其中,Ai表示社交网络中第i个用户节点信息发布的活跃度,i表示社交网络中的用户节点,n表示用户发布信息所选取的时间段的总数,∑表示求和操作,
表示用户发布信息选取的Δtj时间段内用户发布信息的平均数,Δtj表示用户发布信息选取的第j个时间段;(3b)从搜集到的用户节点发布的信息中,提取影响信息传播的邻居节点对信息转发数目、邻居节点对信息评论数目、邻居节点对信息赞同数目;(3c)利用Saaty的9级重要性等级表,计算用户节点信息发布的活跃度、邻居用户节点对信息转发的数目、邻居用户节点对信息评论的数目、邻居用户节点对信息赞同的数目对信息传播影响的权值;(3d)按照下式,计算用户节点对信息传播影响因素的量化值:Ui=αAi+βr1+γ(r2+r3)其中,Ui表示社交网络中第i个用户节点对信息传播影响因素的量化值,α表示用户节点信息发布的活跃度对信息传播影响的权值,Ai表示社交网络中第i个用户节点发布信息的活跃度,β表示邻居用户节点对信息转发的数目对信息传播影响的权值,r1表示邻居用户节点对信息转发数目,γ表示邻居用户节点对信息评论的数目和邻居用户节点对信息赞同的数目对信息传播影响的权值,r2表示邻居用户节点对信息评论数目,r3表示邻居用户节点对信息赞同数目;(4)量化用户节点的话题topic相关度:(4a)搜集与话题topic相关的信息,从所搜集到的与话题topic相关的信息中,提取与话题topic高度相关的高频词汇集wn;(4b)搜集用户节点当前时间段内发布的信息,建立用户节点发布的信息集合Mi;(4c)利用汉词分词工具,对用户节点发布信息集合Mi中的每条信息进行数据处理,建立用户节点发布信息的分词集合Mic;(4d)将用户节点发布信息的分词集合Mic与话题topic高度相关的高频词汇集wn进行对比,采用权值设定方法,得到用户节点发布信息集合Mi中每条信息与话题topic的相关度
(4e)通过下述量化公式,计算用户节点的话题topic相关度:
其中,Ri表示社交网络中第i个用户节点的话题topic相关度,s表示当前时间段内用户节点发布信息的数目,∑表示求和操作,∈表示属于符号,Mi表示社交网络中第i个用户节点发信息集合,mjc表示用户节点发布的信息集合中第j条信息的分词集合,
表示用户节点发布的信息集合中第j条信息与话题topic的相关度;(5)量化用户节点信息传播能力:(5a)按照下式,计算用户节点基本的信息传播能力:
其中,
表示用户节点vi基本的信息传播能力,vi表示社交网络中第i个用户节点,deg(vi)表示用户节点vi的度,Ui表示社交网络中第i个用户节点对对信息传播的影响因素的量化值,Ri表示社交网络中第i个用户节点的话题topic相关度;(5b)依据网络有向图中用户节点间的交互关系,按照下式,计算社交网络用户节点的信息传播能力:
其中,PR(vi)表示社交网络中第i个用户节点vi信息传播能力,d表示阻尼系数,设置为默认值0.85,n表示社交网络中节点的总数,∑表示求和操作,w(vj,vi)表示从社交网络第i个用户节点vi到社交网络第j个用户节点vj信息传播的概率,vi表示社交网络的第i个用户节点,vj表示社交网络的第j个用户节点,*表示相乘操作,
表示社交网络中第j个用户节点出度的大小;(5c)判断相邻两次信息传播能力的差值是否小于0.01,若是,将相邻两次的最后一次计算得到的结果作为社交网络用户节点的信息传播能力,执行步骤(6),否则,执行步骤(5b);(6)识别关键节点:(6a)按照从大到小的顺序,将社交网络用户节点的信息传播能力进行排序;(6b)将排序中的前Q个用户节点作为网络关键节点,Q∈(0,10%)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610364264.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种带有红外遥控的智能电表
- 下一篇:一种远程红外遥控装置