[发明专利]异常账号的识别方法及装置有效
申请号: | 201910982159.0 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110728543B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 吴明平;梁新敏;陈羲;吴明辉 | 申请(专利权)人: | 秒针信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06F16/35 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 刘静 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 账号 识别 方法 装置 | ||
本发明提供了一种异常账号的识别方法及装置,该方法包括:获取待识别账号的账号信息;账号信息包括用户身份信息、用户行为信息和内容发布信息;根据预设算法和账号信息,判断待识别账号是否异常;预设算法包括集中度算法、均值算法、社区检测算法和文本分类算法中的一种或多种;如果是,确定待识别账号的异常类型;异常类型至少包括机器刷帖类型和人为刷帖类型。本发明可以有效提升异常账号识别的准确性和可靠性。
技术领域
本发明涉及网络技术领域,尤其是涉及一种异常账号的识别方法及装置。
背景技术
随着互联网与电商的高速发展,网络购物已经越来越普及,在购买一些商品之前,人们越来越偏向于在一些垂直网站查询相关信息,尤其是一些行业论坛。但是很多行业论坛存在大量水军刷帖情况,而且已经形成了有组织的刷帖行为,这不仅严重影响了网站信誉度,而且容易误导用户的判断。
目前,各大论坛都采取了一些识别水军刷帖账号的方法,包括根据数据统计、网络检测等方式来识别水军刷帖账号。但是,这些方法对于水军刷帖账号的识别都不够准确。
发明内容
有鉴于此,本发明的目的在于提供一种异常账号的识别方法及装置,可以有效提升异常账号识别的准确性和可靠性。
第一方面,本发明实施例提供了一种异常账号的识别方法,包括:获取待识别账号的账号信息;账号信息包括用户身份信息、用户行为信息和内容发布信息;根据预设算法和账号信息,判断待识别账号是否异常;预设算法包括集中度算法、均值算法、社区检测算法和文本分类算法中的一种或多种;如果是,确定待识别账号的异常类型;异常类型至少包括机器刷帖类型和人为刷帖类型。
在一种实施方式中,获取待识别账号的账号信息的步骤,包括:获取待识别账号在预设时段内的账号信息。
在一种实施方式中,预设算法包括集中度算法,根据预设算法和账号信息,判断待识别账号是否异常的步骤,包括:获取待识别账号发布的每条回帖的回帖时间,并计算相邻的两条回帖的回帖时间差;基于回帖时间差将待识别账号发布的回帖划分为多个回帖块;每个回帖块包含有至少一条回帖;同一回帖块内相邻的两条回帖的回帖时间差低于不同回帖块的相邻的两条回帖的回帖时间差;根据每个回帖块内的每条回帖的回帖时间和每个回帖块内的回帖数,计算每个回帖块对应的回帖集中度;根据每个回帖块对应的回帖集中度和回帖块的总数,计算待识别账号的总回帖集中度;判断总回帖集中度是否小于预设阈值;如果是,确定待识别账号异常。
在一种实施方式中,根据每个回帖块内的每条回帖的回帖时间和每个回帖块内的回帖数,计算每个回帖块对应的回帖集中度的步骤,包括:按照如下公式计算每个回帖块对应的回帖集中度:
其中,Cij表示待识别账号i的第j个回帖块的回帖集中度;M表示待识别账号i的第j个回帖块内的回帖数;tm-tm-1表示待识别账号i的第j个回帖块内相邻的两条回帖之间的时间差;根据每个回帖块对应的回帖集中度和回帖块的总数,计算待识别账号的总回帖集中度的步骤,包括:按照如下公式计算待识别账号的总回帖集中度:
其中,Ci表示待识别账号i的总回帖集中度;J表示待识别账号i的回帖块的总数。
在一种实施方式中,预设算法包括均值算法,根据预设算法和账号信息,判断待识别账号是否异常的步骤,包括:获取待识别账号发布的回帖总数以及待识别账号发布的每条回帖的字数;根据待识别账号的回帖总数以及每条回帖的字数,计算待识别账号的平均回帖字数;判断平均回帖字数是否小于预设字数且待识别账号发布的回帖总数是否大于预设总数;如果判断结果均为是,确定待识别账号异常。
在一种实施方式中,根据待识别账号的回帖总数以及每条回帖的字数,计算待识别账号的平均回帖字数的步骤,包括:按照如下公式计算待识别账号的平均回帖字数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于秒针信息技术有限公司,未经秒针信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910982159.0/2.html,转载请声明来源钻瓜专利网。