[发明专利]面向特定主题的隐蔽社区核心交际圈检测发现方法和系统有效
申请号: | 201510160958.1 | 申请日: | 2015-04-07 |
公开(公告)号: | CN106156117B | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 沙灜;毋建军;梁棋 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 余长江 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 特定 主题 隐蔽 社区 核心 交际 检测 发现 方法 系统 | ||
技术领域
本发明涉及社交网络的社区发现与跟踪领域,是一个基于特定主题的隐蔽社区核心交际圈进行快速发现的方法和系统。
背景技术
近年来,随着社交网络的大规模广泛应用,人们越来越多地将线下活动转移到线上社交网络中。社交网络是由许多关系链接而构成的实体网络,在人们的日常生活中发挥了重要的作用,用户与网络之间的交互加快了社会行为向网络行为、现实社会关系向网络社会关系以及社交信息向网络信息的转化。目前,一些微博网站(如Twitter,新浪微博、Facebook、人人网等)逐渐兴起,一方面代表了社交网络的特性,用户可以关注一些用户,随时发表、转发、评论消息等;另一方面表现了媒体特性,很多知名用户第一时间发布相关新闻消息后,这些消息能够被迅速的转发与传播,这种信息扩散的迅速性、规模性、影响力是传统媒体所无法比拟的。越来越多的社会民众通过社交网络来表达想法或者传播观点,社交网络具有交流便捷和传播迅速的特点,信息通过级联的扩散形成了大规模的影响力传播。
在大规模社交网络中,精准定位追踪特定主题下的关键用户,追踪发现特定主题下关键用户所形成的隐性的社区(隐蔽社区),有效提取、界定这些隐蔽社区的规模、所属用户的关系网络、社区演变趋势,对深入研究网络特定主题与网络人际关系、网络特定主题与现实人际关系、网上下人际关系它们之间的内在影响及规律,具有重要的理论及现实意义。
人们在社交网络中所形成的关系,有显性和隐性之分,显性关系是指网络交互行为所形成的链接关系,隐性关系是指不具有显性链接关系的人们之间讨论相同或相似的特定话题,所自发形成的群落。这些围绕特定话题所形成的关系,成为近年来社交网络关系研究的热点问题,尤其是隐性关系的研究,更是成为研究的重点。
基于显性链接关系的研究,主要集中在网络社区划分、发现相关的算法等方面,早期的社区结构划分算法主要有图分割法(Graph Partition)和层次聚类法(Hierarchical Clustering,基于社会学)两大类,其中图分割法以Kernighan-Lin算法和基于图的Laplace矩阵特征值的谱平分法(Spectral Bisection Method)为代表,层次聚类是采用基于各个节点之间连接的相似性或者连接强度,将社交网络进行划分,形成若干个社团。此外,根据向网络中添加边或是从网络中移除边的思路,社区划分的方法又可以分为分裂方法(divisive method)和凝聚方法(agglomerative method)两大类别。在上述的各种网络划分中,无论是GN算法(分裂算法)、快速社团划分算法(NF算法)、CNM算法,还是Informap算法通过在节点和边线之间的动态信息流图,来描述整个全网的状态,都是在基于图的拓扑结构基础上,通过度中心性、接近中心性、介数中心性、特征向量中心性等来计算节点用户的重要程度,划分用户之间的链接关系。但拓扑链接结构划分特定主题下的用户,并不能有效的发现兴趣相似的用户群体及其所形成的隐性社区。
基于不同的研究角度,也有研究者从信息传播模型出发,在社交网络中模拟信息传播,根据传播的范围来采用蒙特卡洛模拟的方式进行节点影响力的评估;基于信息扩散的角度,以粉丝规模数、转发规模数、提及规模数来评价单个用户的影响力,Domingos等人提出社交网络中个人的网络影响力最大化,从该节点出发的信息能传播到达的最大范围。Weng等人基于PageRank的思想提出了TwitterRank算法,采用了综合Twitter的Topic和发布频率的方式改进了概率转移矩阵(也即是用户在某Topic下发表的tweets越多,转移概率就越大)。下面就本发明中关键词语定义如下:
面向特定主题的隐蔽社区:是指在社交网络中,那些不具有显性链接关系的用户讨论主题下系列话题,所自发形成的隐性群落,他们彼此之间没有直接的链接关系或可能并不知道对方的存在。
关键核心用户:是指在讨论主题下系列话题,促使隐性社区自发形成的过程中,话题积极的发起者、推动者或组织者,便为此特定主题下隐蔽社区中的关键核心用户。
主题:主题由一系列话题组成,一个主题可以包含一个或多个话题。话题由关键词来进行表示。
核心交际圈:是指由这些隐蔽社区中的关键核心用户所构成的虚拟链接关系网络,称为特定主题下的隐蔽社区核心交际圈,即为整个隐蔽社区结构构成中的框架。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510160958.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种隔热保温涂料及其制备方法
- 下一篇:一种制袋机