[发明专利]一种广告受众用户数据的处理方法和装置有效
申请号: | 201711377218.9 | 申请日: | 2017-12-19 |
公开(公告)号: | CN109934610B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 徐立鑫 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q30/0241 | 分类号: | G06Q30/0241;G06Q30/0251;G06F16/31 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 受众 用户 数据 处理 方法 装置 | ||
本发明公开了一种广告受众用户数据的处理方法和装置,所述方法包括:按维度生成广告受众用户数据的倒排索引;存储所述倒排索引,生成所述倒排索引的存储位置描述信息;接收涵盖至少一个维度的数据分析条件,根据所述数据分析条件查询所述存储位置描述信息,确定相应倒排索引的存储位置;根据确定的存储位置读取相应的倒排索引,根据所述倒排索引确定数据分析结果。该技术方案针对海量的广告受众数据,根据其数据特点,采用按维度生成倒排索引的方式,可以实现利用倒排索引进行数据的快速检索;而针对同样数量庞大的倒排索引,采用为其设置存储位置描述信息的方式,进一步提高了倒排索引的读取效率,这样分层级地提高了数据分析的效率,效果显著。
技术领域
本发明涉及互联网广告领域,具体涉及一种广告受众用户数据的处理方法和装置。
背景技术
用户在浏览网页时会注意到,在网页的上方、下方或者是悬浮窗中存在着不少广告,这些都属于互联网广告的展示方式,浏览网页的用户也就是广告受众用户。而广告主为了实现广告的精准投放,希望了解哪些人群对自己的产品感兴趣,在现有技术中往往是通过获取广告的展现量、点击量等数据,对这些数据进行分析来确定如何投放广告更加有效。而这些数据与用户是相关的,也就是属于广告受众用户数据,不仅维度众多,数量也庞大,需要一种有效、快速的处理方式。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的广告受众用户数据的处理方法和装置。
依据本发明的一个方面,提供了一种广告受众用户数据的处理方法,包括:
按维度生成所述广告受众用户数据的倒排索引;
存储所述倒排索引,生成所述倒排索引的存储位置描述信息;
接收涵盖至少一个维度的数据分析条件,根据所述数据分析条件查询所述存储位置描述信息,确定相应倒排索引的存储位置;
根据确定的存储位置读取相应的倒排索引,根据所述倒排索引确定数据分析结果。
可选地,所述按维度生成所述广告受众用户数据的倒排索引包括:
调用分布式计算框架Map Reduce生成所述倒排索引;
所述存储所述倒排索引包括:将同一维度下维度特征值相同的倒排索引连续输出至分布式文件系统HDFS的指定路径下。
可选地,所述生成所述倒排索引的存储位置描述信息包括:
记录同一维度下同一维度特征值的倒排索引在所述HDFS上的起始位置和长度,生成全部倒排索引的二级索引。
可选地,该方法还包括:
将所述二级索引保存至Mongo数据库中;
所述根据所述数据分析条件查询所述存储位置描述信息包括:调用Mongo数据库的快速检索功能进行查询。
可选地,所述存储所述倒排索引包括:将所述倒排索引导入列式数据库HBASE中;
所述生成所述倒排索引的存储位置描述信息包括:在所述HBASE中为所述倒排索引设置多个采样点,得到多个采样区间;
所述根据所述数据分析条件查询所述存储位置描述信息包括:根据所述数据分析条件确定至少一个采样区间,从所述HBASE中读取所述采样区间下的倒排索引进行查询。
可选地,所述将所述倒排索引导入列式数据库HBASE中包括:
根据所述倒排索引生成符合HBASE内部数据存储格式的HFile文件;
将所述HFile文件热载入所述HBASE。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711377218.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置