[发明专利]用于识别作弊用户的方法、装置和电子设备有效
申请号: | 201811241546.0 | 申请日: | 2018-10-24 |
公开(公告)号: | CN111091391B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 张宇仁 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00 |
代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 作弊 用户 方法 装置 电子设备 | ||
本发明实施例公开了用于识别作弊用户的方法、装置和电子设备。该方法的一具体实施方式包括:基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性;对于每一个目标组合属性,确定该目标组合属性对应的至少一个组合属性值,以及对于每一个组合属性值,将同时具有该组合属性值中的每一个属性值的不同用户归为同一用户组;对于每一用户组,基于该用户组中各用户的历史用户日志所对应的各属性的属性值确定该组用户的相似度,以及确定该组用户相对于所述多个用户的差异程度;基于所述相似度与所述差异程度确定该用户组是否为作弊用户组。一方面实现了对作弊群体进行识别,另一方面降低了识别作弊群体的计算量。
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于识别作弊用户的方法、装置和电子设备。
背景技术
随着互联网技术的不断发展,互联网上的作弊现象也越来越多。常见的作弊类型包括:曝光作弊,通过刷粉、刷赞、刷销量提高曝光率;转化作弊:在注册、激活、下单等不同场景下通过自动化程序的模拟真人行为等。互联网作弊会严重危害到互联网平台安全性、氛围以及公平性。黑色产业链发现通过互联网坐标获得大量收益,逐渐发展出日益专业化、协作化和规模化的群组作弊的趋势。
但目前对于群组作弊还没有较好的识别方法。
发明内容
本发明实施例提供了一种用于识别作弊用户的方法、装置和电子设备,实现了使用较少的计算量,来对作弊群体进行识别。
第一方面,本发明实施例提供了一种用于识别作弊用户的方法,该方法包括:基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,其中,所述目标组合属性包括至少一个所述属性;对于每一个目标组合属性,确定该目标组合属性对应的至少一个组合属性值,以及对于每一个组合属性值,将同时具有该组合属性值中的每一个属性值的不同用户归为同一用户组,其中所述组合属性值包括该目标组合属性中的每一个属性所对应的属性值;对于每一用户组,基于该用户组中各用户的历史用户日志所对应的各属性的属性值确定该组用户的相似度,以及确定该组用户相对于所述多个用户的差异程度;基于所述相似度与所述差异程度确定该用户组是否为作弊用户组。
可选地,基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,包括:所述基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,包括:从所述多个用户的历史用户日志中,确定出多个属性;对所述多个属性进行组合以得到多个组合属性,其中,每一个组合属性包括至少一个所述属性;基于各组合属性分别所对应的组合属性值的数量,确定出至少一个目标组合属性。
可选地,所述基于所述相似度与所述差异程度确定该用户组是否为作弊用户组,包括:基于所述相似度与所述差异程度的乘积确定该用户组的作弊置信度;响应于所述作弊置信度大于预设作弊置信度阈值,则确定该用户组为作弊用户组。
可选地,该方法还包括:对于每一个用户,从该用户所属的不同用户组分别对应的作弊置信度中查找作弊置信度的最大值,并将所述作弊置信度的最大值确定为该用户的作弊置信度,以确定该用户是否为作弊用户。
可选地,该方法还包括:对于每一个用户,将该用户的作弊置信度所对应的用户组中的其他用户作为该用户的关联作弊用户。
可选地,对于该用户组的历史用户日志中的每一属性,该组用户的相似度与该属性的、所对应的用户数量最大的属性值的占比正相关,其中,所述所对应的用户数量最大的属性值的占比为该属性值对应的用户数量与该用户组中的用户数量之比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811241546.0/2.html,转载请声明来源钻瓜专利网。