[发明专利]一种账号过滤方法、装置、电子设备及机器可读存储介质有效
申请号: | 201911308748.7 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111062013B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 赵艳杰;康林;罗廷方;秦占明 | 申请(专利权)人: | 北京爱奇艺科技有限公司 |
主分类号: | G06F21/31 | 分类号: | G06F21/31;G06F21/45 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 账号 过滤 方法 装置 电子设备 机器 可读 存储 介质 | ||
本发明实施例提供了一种账号过滤方法、装置、电子设备及机器可读存储介质,接收包括登录账号的访问请求,利用第一布隆过滤器,对登录账号进行识别,其中,第一布隆过滤器采用多个第一哈希函数分别对登录账号进行哈希运算,基于运算结果识别登录账号是否为内部账号,如果登录账号为内部账号,则过滤掉该登录账号。基于布隆过滤器对内部账号进行过滤,布隆过滤器的原理是采用多个哈希函数分别对登录账号进行哈希运算,运算结果映射出登录账号是否为内部账号,则本发明实施例不需要建立庞大的数据库来存储内部账号,节省了内存空间,并且,不再需要去数据库中进行遍历查询,提升了账号过滤的效率。
技术领域
本发明涉及网络技术领域,特别是涉及一种账号过滤方法、装置、电子设备及机器可读存储介质。
背景技术
在当前的网络服务中,为了提升用户的使用体验,基于用户的访问数据,向用户推荐感兴趣的视频、网站等数据,需要对用户的登录账号、访问数据等进行统计。然而,在实际的网络系统中,登录账号除了包括用户的登录账号以外,还包括内部运营人员的账号、内部机器人账号等内部账号,这些内部账号在进行网络访问时所产生的访问数据与用户的访问数据无关,因此,在进行统计时,不应统计内部账号产生的访问数据,需要对这些内部账号进行过滤。
在传统的账号过滤方法中,建立了一个数据库,用来存储内部账号,在获取到登录账号时,查询数据库,判断该登录账号是否为内部账号,如果是内部账号,则将该登录账号过滤掉。通过该账号过滤方法,过滤了所有内部账号,只对用户的登录账号所产生的访问数据进行统计。
然而,在实际的网络系统中,内部账号的数量往往是海量的,这就需要建立一个非常庞大的数据库来存储内部账号,并且,在获取到一个登录账号后,需要通过遍历的方式到数据库中进行查询,查询过程耗时很长,导致账号过滤的效率较差。
发明内容
本发明实施例的目的在于提供一种账号过滤方法、装置、电子设备及机器可读存储介质,以提高账号过滤的效率。具体技术方案如下:
第一方面,本发明实施例提供了一种账号过滤方法,该方法包括:
接收访问请求,其中,访问请求包括登录账号;
利用第一布隆过滤器,对登录账号进行识别,其中,第一布隆过滤器采用多个第一哈希函数分别对登录账号进行哈希运算,基于运算结果识别登录账号是否为内部账号;
若登录账号为内部账号,则过滤掉该登录账号。
可选的,在确定登录账号为内部账号之后,该方法还包括:
利用第二布隆过滤器,对登录账号进行识别,其中,第二布隆过滤器采用多个第二哈希函数分别对登录账号进行哈希运算,基于运算结果识别登录账号是否为内部账号,多个第二哈希函数与多个第一哈希函数不完全相同;
若登录账号为内部账号,则过滤掉该登录账号。
可选的,利用第一布隆过滤器,对登录账号进行识别的步骤,包括:
利用多个第一哈希函数,分别对登录账号进行哈希运算,得到多个哈希地址;
从第一预设标记序列中,查找各哈希地址分别对应的标记位;
若各哈希地址分别对应标记位的标记值均为预设标记值,则确定登录账号为内部账号;
若任一哈希地址对应标记位的标记值不为预设标记值,则确定登录账号为非内部账号;
利用第二布隆过滤器,对登录账号进行识别的步骤,包括:
利用多个第二哈希函数,分别对登录账号进行哈希运算,得到多个哈希地址;
从第二预设标记序列中,查找各哈希地址分别对应的标记位;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱奇艺科技有限公司,未经北京爱奇艺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911308748.7/2.html,转载请声明来源钻瓜专利网。