[发明专利]一种刷转发量行为用户的实时识别方法及装置在审
申请号: | 202011353235.0 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112528162A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 王嘉伟 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06Q50/00 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 郭智 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 转发 行为 用户 实时 识别 方法 装置 | ||
本发明实施例提供一种刷转发量行为用户的实时识别方法及装置,其中,所述方法包括:获取所有的转发行为对应的转发用户、被转发微博以及被转发用户;通过第一矩阵和第二矩阵分别记录转发用户与被转发用户以及被转发微博的转发对应数据;通过聚类,获得第一矩阵行向量聚族和第二矩阵行向量聚族;遍历第一矩阵行向量聚族和第二矩阵行向量聚族,将满足条件的第一矩阵行向量聚族中的转发用户加入第一集合,满足条件的第二矩阵行向量聚族中的转发用户加入第二集合;共存于第一集合和第二集合的转发用户即为刷转发量行为用户。根据本发明的技术方案,不仅能识别出发起大量转发的不法分子帐号,还能尽量减小误伤,增加查出率。
技术领域
本发明涉及数据处理领域,具体涉及一种刷转发量行为用户的实时识别方法及装置。
背景技术
在现代的社交媒体的互联网社交平台中,转发是一种非常重要的社交活动。于是出现大量不法分子利用脚本批量的刷转发量,甚至还出现了专门刷转发量的黑色产业链,这些非法的转发行为称为批量转发或者刷转发量。刷转发是对普通用户和对平台都不利的,要想办法找出来。
现有技术实时的接收转发日志,并记录一定时间内个发起关注的ip地址及其对应转发次数,对转发次数大于某阈值的ip认为它发起的所有转发都是刷转发。虽说简单有效,但容易被绕过,也容易误伤公共ip用户的转发行为。
发明内容
本发明实施例提供一种刷转发量行为用户的实时识别方法及装置,不仅能识别出发起大量转发的不法分子帐号,还能尽量减小误伤,增加查出率。
为达到上述目的,一方面,本发明实施例提供了一种刷转发量行为用户的实时识别方法,所述方法包括:
从全站所有的行为日志中提取出设定时间段内所有的转发行为对应的转发用户、被转发微博以及被转发用户;
通过第一矩阵记录转发用户与被转发用户的转发对应数据;通过第二矩阵记录转发用户与被转发微博的转发对应数据;其中,第一矩阵的行向量记录了每一转发用户对应于被转发用户发起转发的数据,第二矩阵的行向量记录每一转发用户对应于被转发微博的转发行为的数据;
分别对所述第一矩阵的行向量和第二矩阵的行向量进行聚类,获得第一矩阵行向量聚族和第二矩阵行向量聚族;
遍历第一矩阵行向量聚族,若聚族的平均发起转发的数量大于第一设定转发阈值,且聚族中的数据点的个数大于第一设定个数阈值,将该聚族中的转发用户加入第一集合;遍历第二矩阵行向量聚族,若聚族的平均转发行为的数量大于第二设定转发阈值,且聚族中的数据点的个数大于第二设定个数阈值,将该聚族中的转发用户加入第二集合;
将存在于第一集合且存在于第二集合的转发用户确定为刷转发量行为用户。
另一方面,本发明实施例提供了一种刷转发量行为用户的实时识别装置,所述装置包括:
数据获取单元,用于从全站所有的行为日志中提取出设定时间段内所有的转发行为对应的转发用户、被转发微博以及被转发用户;
数据处理单元,用于通过第一矩阵记录转发用户与被转发用户的转发对应数据;通过第二矩阵记录转发用户与被转发微博的转发对应数据;其中,第一矩阵的行向量记录了每一转发用户对应于被转发用户发起转发的数据,第二矩阵的行向量记录每一转发用户对应于被转发微博的转发行为的数据;
聚类单元,用于分别对所述第一矩阵的行向量和第二矩阵的行向量进行聚类,获得第一矩阵行向量聚族和第二矩阵行向量聚族;
数据提取单元,用于遍历第一矩阵行向量聚族,若聚族的平均发起转发的数量大于第一设定转发阈值,且聚族中的数据点的个数大于第一设定个数阈值,将该聚族中的转发用户加入第一集合;遍历第二矩阵行向量聚族,若聚族的平均转发行为的数量大于第二设定转发阈值,且聚族中的数据点的个数大于第二设定个数阈值,将该聚族中的转发用户加入第二集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011353235.0/2.html,转载请声明来源钻瓜专利网。