[发明专利]一种目标人群圈选方法、装置及计算机设备有效
申请号: | 201911186757.3 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110648185B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 于为建;李成;王志伟;谢俏;孙迁 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06F16/30 | 分类号: | G06F16/30 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 人群 方法 装置 计算机 设备 | ||
本发明公开了一种目标人群圈选方法、装置及计算机设备,属于互联网技术领域。方法包括:获取用户实时行为数据,对用户实时行为数据进行解析得到用户实时标签数据,并按照预设的位图数据结构生成用户实时标签位图;根据用户实时标签位图和预先构建的用户历史标签位图数据库,生成用户全量标签位图数据库,并构建差异点数据;对差异点数据与预设的人群条件位图库中对应的人群条件位图进行按位运算,根据运算结果,确定人群条件位图中的位数值为预设值的位位置;在预设的条件森林库中确定位数值为预设值的位位置预先映射的条件树,并基于条件树与用户全量标签位图数据库,圈选出目标人群。本发明实施例能够实现高效实时地圈选出符合条件的人群包。
技术领域
本发明涉及互联网技术领域,尤其涉及一种目标人群圈选方法、装置及计算机设备。
背景技术
目前,在海量的互联网数据里面圈选出的人群是否精准直接决定着广告信息投放活动的成败,通常可以通过标签化用户特征行为,并将标签作为筛选人群的条件来筛选出所需要的人群,进行实时广告信息投放,由于需要对不同人群会投放不同的广告信息,因此圈选出不同人群所使用的条件就会千变万化。
现有技术中,可以运用大数据平台的存储计算能力,通过创建任务的方式,为一个筛选的人群条件创建一个计算任务来实现人群包的圈选,但当人群条件的数量越来越多的时候,将造成任务数量越来越多,计算资源需求也越来越多,机器资源总是有限的,就会造成计算瓶颈,延长人群包的圈选时间。
发明内容
为了解决上述背景技术中提到的技术问题,本发明提供了一种目标人群圈选方法、装置及计算机设备,以实现高效实时地圈选出符合条件的人群包。
本发明实施例提供的具体技术方案如下:
第一方面,提供一种目标人群圈选方法,所述方法包括:
获取用户实时行为数据,对所述用户实时行为数据进行解析得到用户实时标签数据,并按照预设的位图数据结构生成用户实时标签位图;
根据所述用户实时标签位图和预先构建的用户历史标签位图数据库,生成用户全量标签位图数据库,并构建差异点数据;
对所述差异点数据与预设的人群条件位图库中对应的人群条件位图进行按位运算,根据运算结果,确定所述人群条件位图中的位数值为预设值的位位置;
在预设的条件森林库中确定所述位数值为预设值的位位置预先映射的条件树,并基于所述条件树与所述用户全量标签位图数据库,圈选出目标人群。
进一步地,所述方法还包括:
获取人群包定义信息的结构化查询语言SQL数据;
对所述结构化查询语言SQL数据进行解析,生成所述人群条件位图和所述条件树,并分别存储至所述人群条件位图库和所述条件森林库中,建立所述人群条件位图中的位数值为预设值的位位置和所述条件树的映射关系。
进一步地,所述对所述结构化查询语言SQL数据进行解析,生成所述人群条件位图和所述条件树,包括:
对所述结构化查询语言SQL数据进行解析,得到所述结构化查询语言SQL数据中的多个元素;
按照所述预设的位图数据结构,对所述结构化查询语言SQL数据中的多个元素进行转换,生成所述人群条件位图;
根据所述结构化查询语言SQL数据中的多个元素,生成SQL条件树以作为所述条件树。
进一步地,所述用户实时标签数据包括用户标识、业务对象、行为类型和时间戳,所述业务对象包括商品品牌、商品类别和店铺中的至少一项,所述行为类型包括针对业务对象进行的浏览、搜索、加购、收藏、提交订单以及支付订单中的至少一项。
进一步地,所述按照预设的位图数据结构生成用户实时标签位图,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911186757.3/2.html,转载请声明来源钻瓜专利网。