[发明专利]线上广告流量分布的校正方法及装置、可读存储介质有效
申请号: | 201811044224.7 | 申请日: | 2018-09-07 |
公开(公告)号: | CN109447675B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 汤奇峰;葛虎跃 | 申请(专利权)人: | 上海晶赞融宣科技有限公司 |
主分类号: | G06Q30/0242 | 分类号: | G06Q30/0242;G06Q30/0241 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李笑笑;吴敏 |
地址: | 200072 上海市静安区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线上 广告 流量 分布 校正 方法 装置 可读 存储 介质 | ||
一种线上广告流量分布的校正方法及装置、可读存储介质,所述线上广告流量分布的校正方法包括获取线上广告流量数据对应的分数分布数据;将所述分数分布数据进行均匀分布变换,得到变换模型;利用变换模型对线上广告流量分数进行实时校正,获得校正后的线上广告流量分数。上述方案能够使得广告流量分数均匀分布,进而可以平稳地控制整体广告流量。
技术领域
本发明属于互联网广告技术领域,特别涉及一种线上广告流量分布的校正方法及装置、可读存储介质。
背景技术
需求方平台(Demand Side Platform,DSP)作为互联网广告投放平台,在该投放系统中常常需要根据业务指标(例如,点击率),对流量做筛选(又称流量定向,流量优选)。一般情况下,在对流量做筛选的阶段使用一个点击率(Click-Through-Rate,CTR)模型等评分模型对每个流量打分,从而获得广告流量分数。其中,广告流量分数越高,代表广告流量在该模型基准下的的质量越高(例如,点击率越高)。因此,根据在线广告流量分数,结合当前的预算和消耗来指定一个合理的分数阈值,使得分数线上的流量可以恰好满足当前的剩余预算。
然而,在实际使用过程中,由于打分模型给出的分数分布不均匀,流量大部分集中在狭窄的分数段区间,这就导致线性调整阈值时流量消耗严重非线性,造成整体流量控制不平稳。因此,针对此种情况,通过对原始流量分布做直方图均衡化变换后,流量分布就会变的均匀很多,后续的流量阈值控制就会平稳许多。
发明内容
本发明实施例解决的是如何使广告流量均匀分布,以平稳地控制整体广告流量。
为解决上述技术问题,本发明实施例提供一种线上广告流量分布的校正方法,线上广告流量分布的校正方法包括:获取线上广告流量数据对应的分数分布数据;将所述分数分布数据进行均匀分布变换,得到变换模型;利用变换模型对线上广告流量分数进行实时校正,获得校正后的线上广告流量分数。
可选的,所述获取线上广告流量数据对应的分数分布数据,包括:选取打分模型;采用所述打分模型对所述线上广告流量数据进行处理,得到分数分布数据。
可选的,所述打分模型为点击率模型。
可选的,所述将所述分数分布数据进行均匀分布变换,包括:将所述线上广告流量按所述线上广告流量分数等间距分桶,并计算各个桶的概率密度;根据所述各个桶的概率密度,计算分数分布数据的累计分布;根据所述累计分布计算均匀分布变换;利用所述均匀分布变换生成直方图变换映射表,得到所述变换模型。
可选的,采用如下公式计算所述各个桶的概率密度:其中,p(si)为si对应的概率密度,si为第i个桶对应的分数分布数据,1≤i≤n,n为等间距分桶后的桶的个数,count(si)为分数si的桶内流量之和,∑count(si)为流量总体之和。
可选的,采用如下公式计算所述分数分布数据的累计分布:cdf(si)=∫p(x)dx;其中,cdf(si)为si对应的累计分布,p(x)为分数分布数据对应的概率密度。
可选的,采用如下公式计算所述均匀分布变换:oi=cdf(si);其中,对任意si、sj,满足si≤sj,变换后,oi≤oj,1≤j≤n,sj为第j个桶对应的分数分布数据,oi为si对应的均匀分布变换,oj为sj对应的均匀分布变换。
可选的,所述利用变换模型对线上广告流量分数进行实时校正,包括:利用变换模型进行实时计算,计算方法为线性插值法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海晶赞融宣科技有限公司,未经上海晶赞融宣科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811044224.7/2.html,转载请声明来源钻瓜专利网。