[发明专利]一种在线社交网络中社群话题的发现方法有效
申请号: | 201410025323.6 | 申请日: | 2014-01-16 |
公开(公告)号: | CN103793489B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 於志文;张星;梁韵基;郭斌;倪红波;王柱 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710129 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 社交 网络 社群 话题 发现 方法 | ||
1.一种在线社交网络中社群话题的发现方法,其特征在于,该具体过程为:
步骤1,基于网络爬虫对目标社交网络进行数据采集;
步骤2,基于采集到的社交网络中用户对象之间的交互关系,计算每个用户对象在交互网络拓扑中的相关度;
步骤3,构建用户对象静态的交互网络;
步骤4,利用层次聚类,根据用户对象的相关度得到紧密的用户社群结构;
步骤5,对于划分出的每个社群,查找数据库获得该社群对应的文本信息,将其作为文档输入,使用SVM分类,计算出该社群的热门话题。
2.根据权利要求1所述的在线社交网络中社群话题的发现方法,其特征在于,
通过下述公式(1)计算用户之间的相关度ηij,并存入数据库中,
其中,ηij表示用户i和用户j的相关度,αij表示用户i对用户j的评论次数,βij表示用户i对用户j的转发次数,γij表示用户i对用户j的分享次数;h1,h2,h3分别表示评论、转发、分享这三种操作的权值。
3.根据权利2所述的在线社交网络中社群话题的发现方法,其特征在于,在上述步骤3中,对于一个含有n个用户的社群Q,设其中的用户分别为U1、U2、...Ui...Un,对于其中任意个用户Ui,通过公式(1)的用户相关度公式,可以计算出其和其它N-1个用户的相关度ηij;
定义向量为用户i的社群相关度向量,则该向量表示用户i对于社群中所有用户的相关度;
计算出社群中所有用户的相关度向量Ai后,定义矩阵T为社群Q的相关度矩阵。
4.根据权利1所述的在线社交网络中社群话题的发现方法,其特征在于,
所述层次聚类,将网络中聚类最近的两个点或者集合不断的聚集在一起,形成新的集合,最后会形成一颗聚类二叉树,根据给定的社群数量,可以将其分割为任意数量的子树,每个子树对应的用户集合就是一个社群,在裁剪的过程中,不断丢弃那些子树个数为一的孤立节点,实现对噪音数据的过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410025323.6/1.html,转载请声明来源钻瓜专利网。