[发明专利]一种刷转发量行为用户的实时识别方法及装置在审
申请号: | 202011353235.0 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112528162A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 王嘉伟 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06Q50/00 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 郭智 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 转发 行为 用户 实时 识别 方法 装置 | ||
1.一种刷转发量行为用户的实时识别方法,其特征在于,包括:
从全站所有的行为日志中提取出设定时间段内所有的转发行为对应的转发用户、被转发微博以及被转发用户;
通过第一矩阵记录转发用户与被转发用户的转发对应数据;通过第二矩阵记录转发用户与被转发微博的转发对应数据;其中,第一矩阵的行向量记录了每一转发用户对应于被转发用户发起转发的数据,第二矩阵的行向量记录每一转发用户对应于被转发微博的转发行为的数据;
分别对所述第一矩阵的行向量和第二矩阵的行向量进行聚类,获得第一矩阵行向量聚族和第二矩阵行向量聚族;
遍历第一矩阵行向量聚族,若聚族的平均发起转发的数量大于第一设定转发阈值,且聚族中的数据点的个数大于第一设定个数阈值,将该聚族中的转发用户加入第一集合;遍历第二矩阵行向量聚族,若聚族的平均转发行为的数量大于第二设定转发阈值,且聚族中的数据点的个数大于第二设定个数阈值,将该聚族中的转发用户加入第二集合;
将存在于第一集合且存在于第二集合的转发用户确定为刷转发量行为用户。
2.如权利要求1所述的刷转发量行为用户的实时识别方法,其特征在于,所述通过第一矩阵记录转发用户与被转发用户的转发对应数据;通过第二矩阵记录转发用户与被转发微博的转发对应数据,包括:
构建大小为n0*n1的全零矩阵M0和大小为n0*m的全零矩阵M1;其中,n0为所有转发用户的数量,n1为所有被转发用户的数量,m为所有被转发微博的数量;
将所有的转发用户在矩阵M0和M1中进行行标记,将所有的被转发用户在矩阵M0中进行列标记,将所有的被转发微博在矩阵M1中进行列标记;
将每一转发行为对应的转发用户和被转发用户在M0中相应位置处的元素值加1,获得第一矩阵;
将每一转发行为对应的转发用户和被转发微博在M1中相应位置处的元素值加1,获得第二矩阵。
3.如权利要求2所述的刷转发量行为用户的实时识别方法,其特征在于,还包括:
如果判断出第一矩阵的秩小于n0和n1的较小者、或者第二矩阵的秩小于n0和m的较小者,则在分别对所述第一矩阵的行向量和第二矩阵的行向量进行聚类之前,确认第一矩阵和第二矩阵均没有全零行。
4.如权利要求3所述的刷转发量行为用户的实时识别方法,其特征在于,采用K-Means聚类方法对所述第一矩阵行向量和第二矩阵的行向量进行聚类。
5.如权利要求4所述的刷转发量行为用户的实时识别方法,其特征在于,所述第一设定转发阈值大于第二设定转发阈值,且第一设定个数阈值大于第二设定个数阈值。
6.一种刷转发量行为用户的实时识别装置,其特征在于,包括:
数据获取单元,用于从全站所有的行为日志中提取出设定时间段内所有的转发行为对应的转发用户、被转发微博以及被转发用户;
数据处理单元,用于通过第一矩阵记录转发用户与被转发用户的转发对应数据;通过第二矩阵记录转发用户与被转发微博的转发对应数据;其中,第一矩阵的行向量记录了每一转发用户对应于被转发用户发起转发的数据,第二矩阵的行向量记录每一转发用户对应于被转发微博的转发行为的数据;
聚类单元,用于分别对所述第一矩阵的行向量和第二矩阵的行向量进行聚类,获得第一矩阵行向量聚族和第二矩阵行向量聚族;
数据提取单元,用于遍历第一矩阵行向量聚族,若聚族的平均发起转发的数量大于第一设定转发阈值,且聚族中的数据点的个数大于第一设定个数阈值,将该聚族中的转发用户加入第一集合;遍历第二矩阵行向量聚族,若聚族的平均转发行为的数量大于第二设定转发阈值,且聚族中的数据点的个数大于第二设定个数阈值,将该聚族中的转发用户加入第二集合;
确定单元,用于将存在于第一集合且存在于第二集合的转发用户确定为刷转发量行为用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011353235.0/1.html,转载请声明来源钻瓜专利网。