[发明专利]一种数据处理方法、装置及存储介质有效
申请号: | 202010673436.2 | 申请日: | 2020-07-14 |
公开(公告)号: | CN111882349B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 冯志祥 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/27;G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
在目标对象的播放过程中,若接收到停止播放请求,采用第一标识信息对所述目标对象进行标记;
若未接收到所述停止播放请求,采用第二标识信息对所述目标对象进行标记;
获取所述目标对象在预设时间段内的日志数据;
基于所述目标对象在预设时间段内的日志数据,确定所述目标对象的第N次曝光时间与针对所述目标对象的第N次点击时间之间的时间差;其中,N为正整数;
根据所述目标对象的标识信息,确定第一阈值;所述目标对象的标识信息包括所述第一标识信息和所述第二标识信息;
当所述时间差小于或等于所述第一阈值时,计算所述目标对象的曝光时长期望值;
当所述目标对象的曝光时长期望值小于预设时长阈值,且所述时间差大于第二阈值时,将所述第N次曝光时间对应的曝光数据以及所述第N次点击时间对应的点击数据确定为异常数据;
从所述日志数据中删除所述异常数据。
2.根据权利要求1所述的方法,其特征在于,所述当所述时间差小于或等于第一阈值时,计算所述目标对象的曝光时长期望值的步骤之前,所述方法还包括:
判断所述时间差是否大于第一阈值;
相应的,所述方法还包括:
当所述时间差大于所述第一阈值时,将所述第N次曝光时间对应的曝光数据以及所述第N次点击时间对应的点击数据确定为异常数据。
3.据权利要求1所述的方法,其特征在于,所述当所述时间差小于或等于第一阈值时,计算所述目标对象的曝光时长期望值包括:
当所述时间差小于或等于第一阈值时,获取所述目标对象的虚拟数据;
基于所述目标对象的虚拟数据,确定所述目标对象的曝光量期望值;
获取所述目标对象的播放速度;
根据所述目标对象的曝光量期望值与所述目标对象的播放速度,确定所述目标对象的曝光时长期望值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标对象的标识信息,确定第一阈值包括:
当所述目标对象的标识信息为所述第一标识信息时,将第一预设值确定为所述第一阈值;
当所述目标对象的标识信息为所述第二标识信息时,将第二预设值确定为所述第一阈值。
5.根据权利要求1所述的方法,其特征在于,所述从所述日志数据中删除所述异常数据的步骤之后,所述方法还包括:
将删除所述异常数据后的日志数据确定为训练数据;
基于预设的算法模型对所述训练数据进行训练,得到对象点击率预测模型。
6.根据权利要求5所述的方法,其特征在于,所述得到对象点击率预测模型的步骤之后,所述方法还包括:
确定待测对象的测试数据;
将所述待测对象的测试数据输入所述对象点击率预测模型,得到所述待测对象的预测点击率;
根据所述待测对象的预测点击率,确定所述待测对象的投放结果。
7.根据权利要求1所述的方法,其特征在于,当所述目标对象的曝光时长期望值小于预设时长阈值,且所述时间差大于第二阈值时,所述方法还包括:
将所述目标对象确定为异常对象;
所述方法还包括:
确定对象投放平台中异常对象的数量,所述对象投放平台中包括至少两个目标对象;
根据所述对象投放平台中的异常对象的数量,确定所述对象投放平台中异常对象的比例;
当所述对象投放平台中异常对象的比例大于预设比例阈值时,发出告警提示信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010673436.2/1.html,转载请声明来源钻瓜专利网。