[发明专利]一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法有效

申请号：	201610383009.4	申请日：	2016-06-01
公开（公告）号：	CN105956184B	公开（公告）日：	2017-05-31
发明（设计）人：	周亚东;党琪;高峰;管晓宏	申请（专利权）人：	西安交通大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	西安智大知识产权代理事务所61215	代理人：	段俊涛
地址：	710049***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种社会网络协作组织垃圾信息发布团体识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及在线社会网络领域，特别涉及一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法。

背景技术

近些年在线社会网络取得了令人瞩目的发展速度，逐渐成为人们的日常生活和获取信息的重要手段。同时，垃圾信息及其发布者随着社会网络的发展以各种形式入侵了各个社会网络。这些垃圾信息发布者利用蓄意的用户行为影响了正常用户的交流和在线活动，或者以传播一些恶意的、错误的信息为目的。例如邮件系统中的垃圾邮件，移动通讯系统中的垃圾短信，微博中的恶意软件和钓鱼网站，购物网站中的虚假评论等等。由于低成本和易传播，这些垃圾信息及其发布者在各个社交网站中变得极为泛滥并且成长迅速。

近期在微博社会网络中，有一种新的协作化及组织化的垃圾信息发布团体成长的极为迅速，被人们称为“水军”。他们受雇于一些公关公司，通过发布某些特定的微博内容来营销他们的产品或者传播特定的观点来影响公众舆情。由于影响公共舆论已经成为一个有竞争性的商业领域，这些用户演变成为一种有组织的协同合作的团体来获取更大的影响力。他们伪装成为普通用户来参与到各个热点话题中。如果某个团体拥有足够多的社交网络账号，那么他们就能轻易的引导某个热点话题的舆论导向。这些组织内的用户通过某个蓄意的观点参与到话题中来，这就会误导人们远离某个话题的真实情况，从而严重影响人们的判断和决定。

发明内容

为了克服上述现有技术的缺点，本发明的目的在于提供一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法，首先通过基于拓扑结构的图相似度，动态地对比热点话题发展过程中的转发网络，来识别垃圾信息发布团体参与的异常话题；在参与多个异常话题的用户中，定义了话题参与用户的权重，通过对多个话题累计用户权重进行聚类来识别垃圾信息发布团体，本发明可解决微博社会网络中垃圾信息发布组织的发现问题，为识别和阻断虚假的、蓄意的网络信息传播提供技术支持。

为了实现上述目的，本发明采用的技术方案是：

一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法，包括：

步骤1，在多个热点话题中发现有垃圾信息发布团体参与的异常话题，具体步骤如下：

步骤1.1，构建热点话题的动态转发网络，热点话题T_i在时间t的转发网络表示为有向图G^t＝(V^t，E^t)，其中V^t和E^t分别是节点集合和边集合，V^t中的任意一个节点表示用户u_i在起始时间到时间t之间发表了话题T_i相关的微博，E^t中任意一条边(u_g，u_k，w_ug，uk)表示用户u_k转发了用户u_g关于话题T_i的微博，w_ug，uk为边的权重，表示用户u_k和u_g之间转发微博的次数；由于热点话题随着时间在不断的动态变化，热点话题T_i的动态转发网络表示为G^t(T_i)＝{G¹，G²，…，G^t}；

步骤1.2，对每个热点话题T_i的转发网络，计算相邻时间段的转发网络的相似度；话题在时间t的转发网络G^t表示为j个弱连通子图G^t＝{g₁^t，g₂^t，…，g_j^t}，其中g_j^t表示第j个弱连通子图；计算相邻时间间隔转发网络的相似度指计算G^t-1＝(V^t-1，E^t-1)和G^t＝(V^t，E^t)之间的相似度sim^t，首先对两个网络的弱连通子图按照节点个数进行排序，分别得到两个网络的弱连通子图序列，两个子图的相似度由对应子图序列之间的斯皮尔曼相关系数来表示；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安交通大学，未经西安交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610383009.4/2.html，转载请声明来源钻瓜专利网。

上一篇：一种采用虚拟现实增强技术制作说明书的方法
下一篇：基于关键字主次分类的XML查询方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法有效

专利文献下载