[发明专利]用于识别作弊用户的方法、装置和电子设备有效
申请号: | 201811241546.0 | 申请日: | 2018-10-24 |
公开(公告)号: | CN111091391B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 张宇仁 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00 |
代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 作弊 用户 方法 装置 电子设备 | ||
1.一种用于识别作弊用户的方法,其特征在于,包括:
基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,其中,所述目标组合属性包括至少一个所述属性;
对于每一个目标组合属性,确定该目标组合属性对应的至少一个组合属性值,以及对于每一个组合属性值,将同时具有该组合属性值中的每一个属性值的不同用户归为同一用户组,其中所述组合属性值包括该目标组合属性中的每一个属性所对应的属性值;
对于每一用户组,基于该用户组中各用户的历史用户日志所对应的各属性的属性值确定该组用户的相似度,以及确定该组用户相对于所述多个用户的差异程度;
基于所述相似度是否大于预设相似度阈值与所述差异程度是否大于预设差异程度阈值,或者基于所述相似度与所述差异程度的乘积,确定该用户组是否为作弊用户组。
2.根据权利要求1所述的方法,其特征在于,所述基于从目标页面的多个用户的历史用户日志的多个属性中,确定出至少一个目标组合属性,包括:
从所述多个用户的历史用户日志中,确定出多个属性;
对所述多个属性进行组合以得到多个组合属性,其中,每一个组合属性包括至少一个所述属性;
基于各组合属性分别所对应的组合属性值的数量,确定出至少一个目标组合属性。
3.根据权利要求1所述的方法,其特征在于,所述基于所述相似度是否大于预设相似度阈值与所述差异程度是否大于预设差异程度阈值,或者基于所述相似度与所述差异程度的乘积,确定该用户组是否为作弊用户组,包括:
基于所述相似度与所述差异程度的乘积确定该用户组的作弊置信度;
响应于所述作弊置信度大于预设作弊置信度阈值,则确定该用户组为作弊用户组。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对于每一个用户,从该用户所属的不同用户组分别对应的作弊置信度中查找作弊置信度的最大值,并将所述作弊置信度的最大值确定为该用户的作弊置信度,以确定该用户是否为作弊用户。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对于每一个用户,将该用户的作弊置信度所对应的用户组中的其他用户作为该用户的关联作弊用户。
6.根据权利要求1-5任一项所述的方法,其特征在于,对于该用户组的历史用户日志中的每一属性,该组用户的相似度与该属性的、所对应的用户数量最大的属性值的占比正相关,其中,所述所对应的用户数量最大的属性值的占比为该属性值对应的用户数量与该用户组中的用户数量之比。
7.根据权利要求1-5任一项所述的方法,其特征在于,
对于每一个用户组,该用户组的相似度与所述多个用户中,同时具有该用户组的目标组合属性值子组的各属性值的用户数量正相关;其中,所述目标组合属性值子组基于如下步骤确定:
从该用户组的各用户的历史用户日志所具有的各个属性的属性值中确定出多个组合属性值子组,其中,所述组合属性值子组中所包括的属性值的数量大于该用户组所对应的组合属性值中的属性值的数量;将在该用户组中所对应的用户的数量大于其他组合属性值子组在该用户组中所对应的用户数量的组合属性值子组确定为该用户组的目标组合属性值子组。
8.根据权利要求1-5任一项所述的方法,其特征在于,对于每一个用户组,该组用户的差异程度与该组用户对应的历史用户日志的每一属性的分布直方图差异正相关;其中
每一个属性的分布直方图差异由如下步骤确定:
确定该用户组的该属性的分布直方图;确定所述多个用户的该属性的分布直方图;基于预设统计方法从所述该用户组的该属性的分布直方图和所述多个用户的该属性的分布直方图中统计出该属性的分布直方图差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811241546.0/1.html,转载请声明来源钻瓜专利网。