[发明专利]一种在线社交网络中社群话题的发现方法有效
申请号: | 201410025323.6 | 申请日: | 2014-01-16 |
公开(公告)号: | CN103793489B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 於志文;张星;梁韵基;郭斌;倪红波;王柱 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710129 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 社交 网络 社群 话题 发现 方法 | ||
技术领域
本发明涉及社会计算技术领域,尤其涉及一种在线社交网络中社群话题的发现方法。
背景技术
随着网络技术的发展,互联网正逐渐成为人们交往的重要渠道,人与人之间的社会网络关系蕴藏进了互联网中,诞生了社交网络服务。在社交网站通过在线服务向其用户提供服务的过程中,用户间形成了基于网络的成员之间的社交网络关系。社交网络在我们的日常生活扮演重要角色。人们通过社会性关系来完成互相间的通信和信息分享。在这个过程中,形成了社交网络中的话题。
社交网络是基于用户关系实现信息的分享、获取以及传播的互联网平台。用户利用社交网络构建和维持着自身的人际网络关系,并在相关平台上发布消息。社交网络中通常包括一些松散的用户集群,其中的成员相互联系较之其余用户更加密切,我们称之为社群。发现这种固有的社会结构中的话题分布有助于我们更深入地了解社交网络的信息传播规律。
中国专利200880124053.7、201210210349.9提出了一些在线社交网络的社群识别方法,但是无法在划分的社群中发现话题。专利201210514421.7提出使用专家知识人工去除噪音用户发现社交网络中的重要目标和专利201210054254.2采用分析用户话题链接行为识别社交网络中的话题领袖,都只能获得社交网络核心用户的话题内容。专利201210350117.3提出了一种发现社交网络中弱链接的方法,可以有效寻找到话题路径,但是无法发现具体的话题。专利201210210349.9能够挖掘社交网络中话题核心圈,依旧无法覆盖所有社群的话题。
鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本创作。
发明内容
本发明的目的在于提供一种在线社交网络中社群话题的发现方法,用以克服上述技术缺陷。
为实现上述目的,本发明提供一种在线社交网络中社群话题的发现方法,该具体过程为:
步骤1,基于网络爬虫对目标社交网络进行数据采集;
步骤2,基于采集到的社交网络中用户对象之间的交互关系,计算每个用户对象在交互网络拓扑中的相关度;
步骤3,构建用户对象静态的交互网络;
步骤4,利用层次聚类,根据用户对象的相关度得到紧密的用户社群结构;
步骤5,对于划分出的每个社群,查找数据库获得该社群对应的文本信息,将其作为文档输入,使用SVM分类,计算出该社群的热门话题。
进一步,
通过下述公式(1)计算用户之间的相关度ηij,并存入数据库中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410025323.6/2.html,转载请声明来源钻瓜专利网。