[发明专利]确定广告投放人群的方法、装置和计算机可读存储介质在审
申请号: | 201711479527.7 | 申请日: | 2017-12-29 |
公开(公告)号: | CN109993551A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 周巍 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 广告投放 搜索热词 用户群 圈选 词词 计算机可读存储介质 人群 行为数据 热词 预设时间段 投放 广告 消耗 合并 | ||
本发明公开了确定广告投放人群的方法、装置和计算机可读存储介质。所述方法包括:获取预设时间段内的搜索行为数据;根据搜索行为数据,确定搜索热词词群、搜索冷词词群,以及确定与搜索热词词群中的各搜索热词对应的搜索用户、与搜索冷词词群中的各搜索冷词对应的搜索用户;获取与待投放广告对应的一组圈选词;根据该组圈选词确定搜索热词词群中的圈选热词,根据圈选热词确定第一搜索用户群;根据该组圈选词确定搜索冷词词群中的圈选冷词,根据圈选冷词确定第二搜索用户群;对第一搜索用户群和第二搜索用户群进行合并,得到与待投放广告对应的广告投放人群。该技术方案提高了广告投放人群的确定效率,降低了资源的消耗。
技术领域
本发明涉及互联网广告领域,具体涉及确定广告投放人群的方法、装置和计算机可读存储介质。
背景技术
互联网广告目前的技术趋势是针对不同的用户投放最贴近用户需求的广告,这就需要对大量数据进行分析。例如,用户的搜索行为可以反映出用户的需求,因此对搜索行为数据进行分析以确定广告投放人群是一种很好的思路,但是搜索行为数据的数据量通常是极为庞大的,普通的数据分析方法效率低,资源消耗大。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的确定广告投放人群的方法、装置和计算机可读存储介质。
依据本发明的一个方面,提供了一种确定广告投放人群的方法,包括:
获取预设时间段内的搜索行为数据;
根据所述搜索行为数据,确定搜索热词词群、搜索冷词词群,以及确定与所述搜索热词词群中的各搜索热词对应的搜索用户、与所述搜索冷词词群中的各搜索冷词对应的搜索用户;
获取与待投放广告对应的一组圈选词;
根据该组圈选词确定所述搜索热词词群中的圈选热词,根据所述圈选热词确定第一搜索用户群;
根据该组圈选词确定所述搜索冷词词群中的圈选冷词,根据所述圈选冷词确定第二搜索用户群;
对所述第一搜索用户群和第二搜索用户群进行合并,得到与所述待投放广告对应的广告投放人群。
可选地,所述获取预设时间段内的搜索行为数据包括:
获取一个或多个搜索引擎的日志数据,从所述日志数据中提取预设时间段内的搜索行为数据。
可选地,所述根据所述搜索行为数据,确定搜索热词词群、搜索冷词词群包括:
将所述搜索行为数据中,搜索次数大于第一预设值的搜索词汇总为备选搜索词词群;
将所述备选搜索词词群中搜索频率大于或等于第二预设值的搜索词汇总为搜索热词词群,搜索频率小于第二预设值的搜索词汇总为搜索冷词词群。
可选地,所述将所述搜索行为数据中,搜索次数大于第一预设值的搜索词汇总为备选搜索词词群包括:
利用分布式计算框架MapReduce生成备选搜索词词群中各搜索词与搜索用户标识的对应关系;
所述确定与所述搜索热词词群中的各搜索热词对应的搜索用户、与所述搜索冷词词群中的各搜索冷词对应的搜索用户包括:
根据备选搜索词词群中各搜索词与搜索用户标识的对应关系,生成搜索热词词群中各搜索热词与搜索用户标识的对应关系,以及生成搜索冷词词群中各搜索冷词与搜索用户标识的对应关系。
可选地,该方法还包括:
在获取与待投放广告对应的一组圈选词后,生成广告投放人群标识,建立各圈选词与所述广告投放人群标识的对应关系;
所述根据该组圈选词确定所述搜索热词词群中的圈选热词,根据所述圈选热词确定第一搜索用户群包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711479527.7/2.html,转载请声明来源钻瓜专利网。