[发明专利]一种确定目标人群的方法、装置、电子设备和存储介质在审
申请号: | 202110044581.9 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112734486A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 潘峰;赵立超 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 100082 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 目标 人群 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种确定目标人群的方法、装置、电子设备和存储介质,该方法包括:获取人群中每个用户的日志文件,其中,所述人群的数量至少为两个;基于所述人群中每个用户的日志文件,获取所述人群中每个所述用户的设备标识;基于所述人群中每个所述用户的设备标识,计算每个所述人群之间的交并差量级;根据所述交并差量级确定投放广告的目标人群。这样,可以快速计算出每个人群之间的交并差量级,并通过交并差量级快速确定目标人群,既提高了计算交并差量级的速度,又减少了在计算结果人群时的资源浪费。并且通过这种方法确定出的目标人群更精准,提高了广告投放的精准度。
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种确定目标人群的方法、装置、电子设备和存储介质。
背景技术
互联网广告当前的技术趋势是针对不同的用户投放最贴近用户需求的广告,广告主在投放广告之前,需要预先了解两个人群交并差之后的量级是多少,是否满足自己的要求。
现有技术中,实现交并差功能都需要通过执行交并差任务的方式,最终形成一个新的人群包,然后去统计这个新的人群包的数量来作为交并差的结果,广告主查看新的人群包的量级是否满足需求,来确定投放广告的目标人群。这种方法是根据每个人群包的大小来计算,计算的时间并不能保证。并且监测到的用户数据量十分巨大,需要消耗集群的资源,而且每次新生成的交并差结果和量级不可复用,非常定制化,这样每次计算的时候都需要执行任务去统计,资源消耗量非常大,并且计算速度也很慢。
发明内容
有鉴于此,本申请的目的在于提供一种确定目标人群的方法、装置、电子设备和存储介质,用于解决现有技术中确定目标人群速度慢、消耗计算资源较大的问题。
第一方面,本申请实施例提供了一种确定目标人群的方法,所述方法包括:
获取人群中每个用户的日志文件,其中,所述人群的数量至少为两个;
基于所述人群中每个用户的日志文件,获取所述人群中每个所述用户的设备标识;
基于所述人群中每个所述用户的设备标识,计算每个所述人群之间的交并差量级;
根据所述交并差量级确定投放广告的目标人群。
可选的,所述基于所述人群中每个所述用户的设备标识,计算每个所述人群之间的交并差量级,包括:
基于所述人群中每个所述用户的设备标识,计算所述人群所对应的量级;
基于所述人群所对应的量级,计算每个所述人群之间的交并差量级。
可选的,所述基于所述人群中每个所述用户的设备标识,计算所述人群所对应的量级,包括:
将所述人群中每个所述用户的设备标识进行转换,得到每个所述用户的设备标识所对应的字符串;
将每个所述字符串进行分桶记录;
根据分桶后的字符串,记录每个桶所对应的特征值;
根据所述特征值,计算所述人群所对应的量级;
基于所述人群所对应的量级,计算每个所述人群之间的交并差量级。
可选的,所述交并差量级包括并的量级;所述每个所述人群之间的交并差量级是通过以下步骤计算的:
将多个所述人群中每个所述用户的设备标识所对应的字符串进行去重处理;
根据去重后每个人群中所述用户的用户标识所对应的字符串,确定多个人群之间并的量级;
所述交并差量级包括交的量级;所述每个所述人群之间的交并差量级是通过以下步骤计算的:
基于所述每个人群所对应的量级的和以及所述多个人群之间并的量级,计算多个人群之间交的量级;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110044581.9/2.html,转载请声明来源钻瓜专利网。