[发明专利]一种信息处理方法、装置及电子设备有效
申请号: | 201910039914.1 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109828970B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 余文喆;罗华林;唐锦阳;简智涵 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06F16/25 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 电子设备 | ||
本发明实施例提供了一种信息处理方法、装置及电子设备,其中,信息处理方法包括:获取信息查询指令,其中,所述信息查询指令包含指定时段和指定指标;按照所述信息查询指令,在预先建立的用户信息表中,获取所述指定时段内各指定指标的目标信息;所述用户信息表为以数据仓库工具Hive表分区中实时用户行为数据为基础,按照用户行为属性建立的分别统计每天用户行为数据得到的信息表;分别生成包含每种所述指定指标的目标信息的每个信息中间表;针对每个所述信息中间表,获得该信息中间表的指定指标的目标数值。本发明实施例实现了方便、快捷的得到跨天指标数据。
技术领域
本发明涉及计算机技术领域,特别是涉及一种信息处理方法、装置及电子设备。
背景技术
随着互联网技术的快速发展,涌现出大量的互联网应用程序,通过各应用程序实现用户的多样化信息访问需求。
目前,推荐类应用程序通过数据仓库工具Hive表分区,实现用户行为数据的存储。Hive表通常为按天建立的实时存储用户行为数据的数据表,即为,每天生成一个实时存储用户行为数据的Hive表分区,进而满足生成天级报表的需求。然而,随着推荐产品不断更迭,参考的优化指标也越来越丰富和全面,不再局限于当日数据。进而需要用户跨天数据统计用户的跨天指标,例如:次日用户留存和用户分层效果等。现有方法直接从多个Hive表分区中获取实时存储的用户行为数据,进行跨天指标计算。
发明人在实现本发明的过程中发现,现有方法从多个Hive表分区中获取实时存储的用户行为数据进行跨天指标计算时,统计的数据量较大,且计算不同时间区间的指标需要反复查找多个Hive表分区,进而影响跨天指标计算的效率。因此,如何方便、快捷的得到跨天指标数据仍然是亟待解决的问题。
发明内容
本发明实施例的目的在于提供一种信息处理方法、装置及电子设备,以实现方便、快捷的得到跨天指标数据。具体技术方案如下:
第一方面,本发明实施例公开了一种信息处理方法,所述方法包括:
获取信息查询指令,其中,所述信息查询指令包含指定时段和指定指标;
按照所述信息查询指令,在预先建立的用户信息表中,获取所述指定时段内各指定指标的目标信息;所述用户信息表为以数据仓库工具Hive表分区中实时用户行为数据为基础,按照用户行为属性建立的分别统计每天用户行为数据得到的信息表;
分别生成包含每种所述指定指标的目标信息的每个信息中间表;
针对每个所述信息中间表,获得该信息中间表的指定指标的目标数值。
可选地,建立所述用户信息表的步骤,包括:
获取指定项目分类,建立包含所述指定项目分类的用户信息表;
获取历史Hive表分区中各用户的用户行为数据;
按照所述历史Hive表分区中各用户的用户行为数据,添加所述用户信息表中各所述指定项目的数据。
可选地,所述方法还包括:
获取当日Hive表分区中各用户的用户行为数据;
按照所述当日Hive表分区中各用户的用户行为数据,更新所述用户信息表中各所述指定项目的数据。
可选地,所述信息中间表包括第一信息中间表和第二信息中间表,所述分别生成包含每种所述指定指标的目标信息的每个信息中间表,包括:
当所述目标信息中包含用户点击量和展示访问量时,以所述用户点击量和所述展示访问量为基础,生成包含所述指定时段的访问用户的所述第一信息中间表;
对所述目标信息中用户行为数据的数据量进行用户分层,生成包含所述指定时段的各用户层的各所述第二信息中间表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910039914.1/2.html,转载请声明来源钻瓜专利网。