[发明专利]数据处理方法及系统在审
申请号: | 202011375991.3 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112308637A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 李哲 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2455;G06F16/27 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 邓小玲 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 系统 | ||
本申请公开了一种数据处理方法,该方法包括:接收定向组合;根据所述定向组合查询预先生成的抽样数据库,得到第一预估用户数;根据所述第一预估用户数和所述抽样数据库的抽样比例确定第二预估用户数;将所述第二预估用户数作为所述定向组合的预估结果返回给客户端。本申请还公开了一种数据处理系统、电子装置和计算机可读存储介质。由此,能够在超大数据量的情况下根据任意数量定向条件的任意组合,毫秒级地返回预估的覆盖用户数,反馈迅速且预估结果准确,有效提升了用户体验。
技术领域
本申请涉及数据分析技术领域,尤其涉及一种数据处理方法、系统、电子装置及计算机可读存储介质。
背景技术
在互联网媒体的推广系统(例如广告投放系统)中,会提供多种多样的定向条件供客户(广告主)选择,例如性别、年龄等。客户通过选择这些定向条件,可以生成相应的定向组合,指定自己的广告投放的目标人群,从而提升投放效果,降低投放成本。而对于媒体来说,也可以更精细的切分流量,获取更多的收入。
在选择定向条件的过程中,客户往往无法预期所选的定向组合是否能够达到自己满意的效果,因此主流的推广系统通常会提供定向预估的功能,即选择定向组合时,在投放页面上显示出该定向组合预计能覆盖多少用户数,从而给客户提供一个依据,用以判断该定向组合是否符合预期。
定向预估通常是根据客户选择的定向组合查询历史上的媒体访问情况,获取历史的定向覆盖用户数,以该用户数作为一个预估结果提供给客户。由于从长期来看,媒体的用户组成结构趋于稳定,因此按照历史的定向覆盖用户数可以比较准确的预估未来的定向覆盖用户数。
然而对于比较大型的媒体,单日的访问量可达到亿级至百亿级,数据量非常巨大,同时定向条件及其组合可能存在成千上万种,因此如何快速且准确的得到预估的定向覆盖用户数,成为一个难题。
需要说明的是,上述内容并不用于限制申请保护范围。
发明内容
本申请的主要目的在于提出一种数据处理方法、系统、电子装置及计算机可读存储介质,旨在解决如何在定向数量多且组合多变的情况下提供一种适用于超大数据量的快速准确的用户数量预估方式的问题。
为实现上述目的,本申请实施例提供了一种数据处理方法,所述方法包括:
接收定向组合;
根据所述定向组合查询预先生成的抽样数据库,得到第一预估用户数;
根据所述第一预估用户数和所述抽样数据库的抽样比例确定第二预估用户数;及
将所述第二预估用户数作为所述定向组合的预估结果返回给客户端。
可选地,所述方法在接收定向组合之前还包括:
根据原始用户数据集合和所述抽样比例生成所述抽样数据库。
可选地,所述根据原始用户数据集合和所述抽样比例生成所述抽样数据库包括:
获取所述原始用户数据集合;
获取所述抽样比例;
按照所述抽样比例从所述原始用户数据集合中进行随机抽样,得到抽样用户数据;
将所述抽样用户数据导入所述抽样数据库。
可选地,所述根据原始用户数据集合和所述抽样比例生成所述抽样数据库在获取所述抽样比例之前还包括:
根据实际需求配置所述抽样比例。
可选地,所述抽样数据库为分析型分布式数据库。
可选地,所述根据所述定向组合查询预先生成的抽样数据库,得到第一预估用户数包括:
根据所述定向条件组合生成相应的数据库查询语句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011375991.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务数据采集方法、装置、存储介质和计算设备
- 下一篇:音圈组件和发声器件