[发明专利]一种累计用户的统计方法、装置及计算机可读存储介质在审
申请号: | 201810400950.1 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108549596A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 彭小春 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34;G06F17/30 |
代理公司: | 深圳协成知识产权代理事务所(普通合伙) 44458 | 代理人: | 章小燕 |
地址: | 518000 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机可读存储介质 计算量 统计 通讯技术领域 活跃用户 死机 相加 筛选 失败 | ||
本发明公开了一种累计用户的统计方法、装置及计算机可读存储介质,属于通讯技术领域。所述方法包括:从当前日的活跃用户中筛选出新增用户;计算当前日新增用户的数量Ni;获取前一日的累计用户的数量Mi‑1;根据公式Mi=Mi‑1+Ni,计算当前日的累计用户数量Mi;其中,i为大于或等于1的整数,代表从统计日起到当日为第几天。采用本发明,只需要将统计当天的新增用户数量与前一日的累计用户的数量相加即可,减少了计算量,能够有效避免因计算量过于庞大造成的死机或计算失败的问题。
技术领域
本发明涉及通讯技术领域,尤其涉及一种累计用户的统计方法、装置及计算机可读存储介质。
背景技术
在做大数据统计时,常常需要统计累计用户这个数据。所谓累计用户,指的是到当前时间为止,总共有多少个不重复的用户。比如某应用2016-01-01上线,统计2018-04-01的累计用户,则需要统计(2016-01-01到2018-04-01)这个区间的用户数,并进行去重处理。同理,统计2018-04-04的累计用户,则需要计算(2016-01-01到2018-04-04)这个区间的用户数进行去重。
现有技术中,统计累计用户时可以通过从每天的活跃用户中去重实现,如,用户1可能在统计区间内的每一天都活跃一或多次,但是在统计累计用户时,该用户只能算一次。假设应用有50个用户,在30天每天活跃1次,那么累计用户数的去重数据量=50*30=1500条,由此可见,现有技术中统计累计用户时,计算量非常大,在机器有限的前提下,往往是跑不动的,容易造成死机或计算失败。
发明内容
有鉴于此,本发明的目的在于提供一种累计用户的统计方法、装置及计算机可读存储介质,以解决现有技术统计累计用户时,计算量非常大,在机器有限的前提下,往往是跑不动的,容易造成死机或计算失败的问题。
本发明解决上述技术问题所采用的技术方案如下:
根据本发明的第一个方面,提供一种累计用户的统计方法,所述统计方法包括以下步骤:
从当前日的活跃用户中筛选出新增用户;
计算当前日新增用户的数量Ni;
获取前一日的累计用户的数量Mi-1;
根据公式Mi=Mi-1+Ni,计算当前日的累计用户数量Mi;
其中,i为大于或等于1的整数,代表从统计日起到当日为第几天。
可选的,所述从当前日的活跃用户中筛选出新增用户,包括;
采集客户端的用户登陆信息;
对所述用户登陆信息进行去重处理获取活跃用户表;
将所述活跃用户表与已存的新增用户表进行比对;
若所述新增用户表中不存在与某个活跃用户信息相同的用户信息,则确定所述活跃用户为新增用户,并将其存储到所述新增用户表中。
可选的,所述方法还包括:
预先构建累计用户表和新增用户表;
其中,所述累计用户表包括日期以及所述日期对应的累计用户的数量,所述新增用户表包括日期以及与所述日期的新增用户的信息。
可选的,所述方法还包括:
预先构建并维护时间表,所述时间表中仅存储了从应用上线时间到当前时间每天的日期;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810400950.1/2.html,转载请声明来源钻瓜专利网。