[发明专利]基于大数据的异常用户识别方法及装置、电子设备、介质在审
申请号: | 201811135904.X | 申请日: | 2018-09-28 |
公开(公告)号: | CN109408556A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 黄强 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 波动特征 异常用户 特征波动 行为数据 异常特征 大数据 属性表 最小支持度 波动指数 电子设备 特征统计 行为日志 用户识别 阈值判断 概率 统计 | ||
本公开提供了一种异常用户识别方法及装置,属于大数据技术领域。该方法包括:获取多个用户的行为日志,并按照周期与特征统计每个所述用户的行为数据;计算每个所述用户的每个所述特征在各所述周期的行为数据的波动指数,并根据波动阈值判断每个所述用户的每个所述特征是否为波动特征,得到用户‑特征波动属性表;统计所述用户‑特征波动属性表中各波动特征组合的出现概率,将所述出现概率达到最小支持度的波动特征组合判断为异常特征组合;将所述用户中波动特征包含任一所述异常特征组合的用户识别为异常用户。本公开可以实现对异常用户的准确识别,并具有较强的通用性。
技术领域
本公开涉及大数据技术领域,尤其涉及一种基于大数据的异常用户识别方法及装置、电子设备、计算机可读存储介质。
背景技术
互联网以及各种基于互联网的应用程序(Application,简称App)的发展极大的方便了人们的日常生活,然而也有一些用户通过滥用互联网或App服务获取不正当利益,例如网络上出现的虚假用户、虚假“粉丝”、恶意刷单、恶意广告等异常用户及异常用户行为,影响了网站或App的正常运营,因此需要将这些异常用户行为识别出来并加以处理。
现有的异常用户识别方法多数是建立异常用户的特征数据库,然后将待识别的用户行为数据与该特征数据库进行匹配,例如进行正则匹配或计算行为数据的余弦相似度等,根据匹配的结果做出判断。然而该方法需要事先建立特征数据库,在缺乏经验数据或历史数据的情况下难以适用;并且用户行为具有复杂的多样性,特征数据库难以覆盖所有类型的异常用户,因此通过特征数据库匹配容易产生遗漏,影响识别结果的准确性。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于大数据的异常用户识别方法及装置、电子设备、计算机可读存储介质,进而至少在一定程度上克服现有的异常用户识别方法适用范围小、准确性较低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种基于大数据的异常用户识别方法,所述方法包括:获取多个用户的行为日志,并按照周期与特征统计每个所述用户的行为数据;计算每个所述用户的每个所述特征在各所述周期的行为数据的波动指数,并根据波动阈值判断每个所述用户的每个所述特征是否为波动特征,得到用户-特征波动属性表;统计所述用户-特征波动属性表中各波动特征组合的出现概率,将所述出现概率达到最小支持度的波动特征组合判断为异常特征组合;将所述用户中波动特征包含任一所述异常特征组合的用户识别为异常用户。
在本公开的一种示例性实施例中,所述方法还包括:统计所述用户-特征波动属性表中所述异常特征组合的关联概率,将所述关联概率小于最小置信度的异常特征组合从所述异常特征组合的集合中移除。
在本公开的一种示例性实施例中,根据波动阈值判断每个所述用户的每个所述特征是否为波动特征包括:确定每个所述特征的波动阈值;比较每个所述用户的每个所述特征的波动指数与所述特征的波动阈值;如果所述波动指数大于所述波动阈值,则将所述用户的所述特征判断为波动特征。
在本公开的一种示例性实施例中,所述方法还包括:在得到所述用户-特征波动属性表后,统计每个所述特征在全部所述用户中被判断为波动特征的比例;从所述用户-特征波动属性表中移除所述比例大于用户波动比例阈值的特征。
在本公开的一种示例性实施例中,所述方法还包括:根据每个所述波动特征组合的波动特征数量确定每个所述波动特征组合的最小支持度。
在本公开的一种示例性实施例中,所述波动特征组合的波动特征数量大于或等于3。
在本公开的一种示例性实施例中,所述波动指数包括方差、标准差、相对标准偏差、异常数据比例与相对极差中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811135904.X/2.html,转载请声明来源钻瓜专利网。