[发明专利]一种数据处理方法及装置在审
申请号: | 202011137850.8 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112269726A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 曾炎明;卞欣彤;张李伟;李深远 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 陈彦如 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,应用于hive框架,包括:
获取目标用户的与预设行为对应的用户行为数据;
确定与所述目标用户的所述预设行为唯一对应的目标位图,其中,不同所述目标用户的所述预设行为对应不同的位图;
利用所述目标位图存储所述用户行为数据;
利用所述目标位图进行针对所述用户行为数据的分析处理。
2.根据权利要求1所述的数据处理方法,其特征在于,所述利用所述目标位图存储所述用户行为数据,包括:
基于预设的映射关系,确定与所述用户行为数据对应的行为标识以得到相应的目标行为标识;
将所述目标行为标识存储至所述目标位图。
3.根据权利要求2所述的数据处理方法,其特征在于,所述将所述目标行为标识存储至所述目标位图,包括:
将所述目标行为标识直接添加至所述目标位图的预设位置。
4.根据权利要求3所述的数据处理方法,其特征在于,所述利用所述目标位图进行针对所述用户行为数据的分析处理,包括:
针对任一所述目标用户对应的所述目标位图,确定最后一个存储至所述目标位图的行为标识对应的行为时间数据与第一目标时间段的第一时间间隔以及与第二目标时间段的第二时间间隔;
分别利用所述第一时间间隔和所述第二时间间隔以及所述目标位图判断所述目标用户在所述第一目标时间段以及所述第二目标时间段是否存在所述预设行为;
若所述目标用户在所述第一目标时间段以及所述第二目标时间段均存在所述预设行为,则确定所述目标用户为留存用户;其中,所述第二目标时间段为所述第一目标时间段的下一时间段;
统计所述留存用户的第一用户数量;
统计在所述第一目标时间段存在所述预设行为的所述目标用户的第二用户数量;
利用所述第一用户数量和所述第二用户数量确定用户留存率。
5.根据权利要求2所述的数据处理方法,其特征在于,所述将所述目标行为标识存储至所述目标位图,包括:
若所述目标位图中的最近行为标识表示所述目标用户在上一时间段不存在该预设行为,则将所述目标位图中的预设行为标识加1,并将所述最近行为标识更新为所述目标行为标识;
若所述目标位图中的最近行为标识表示所述目标用户在上一时间段存在该预设行为,则对所述最近行为标识、所述预设行为标识进行转移记录,以迁移至所述目标位图中的第一预设历史行为区域,并将所述预设行为标识置0,然后将所述最近行为标识更新为所述目标行为标识。
6.根据权利要求1所述的数据处理方法,其特征在于,所述利用所述目标位图存储所述用户行为数据,包括:
将存在所述预设行为的行为时间数据存储至所述目标位图,将不存在所述预设行为的所述行为时间数据丢弃。
7.根据权利要求6所述的数据处理方法,其特征在于,所述利用所述目标位图进行针对所述用户行为数据的分析处理,包括:
利用第一目标时间段以及第二目标时间段对应的正则表达式对任一所述目标用户的所述目标位图进行匹配,若在所述目标位图中匹配到所述第一目标时间段和所述第二目标时间段,则判定该目标位图对应的所述目标用户为留存用户,其中,所述第二目标时间段为所述第一目标时间段的下一时间段;
统计所述留存用户的第一用户数量;
统计匹配到所述第一目标时间段的所述目标位图的数量以得到第二用户数量;
利用所述第一用户数量和所述第二用户数量确定用户留存率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011137850.8/1.html,转载请声明来源钻瓜专利网。