[发明专利]数据处理方法和装置有效

专利信息
申请号: 201610900390.7 申请日: 2016-10-14
公开(公告)号: CN107527091B 公开(公告)日: 2021-05-25
发明(设计)人: 李毅;金涬;张书彬;郭志懋;薛伟 申请(专利权)人: 腾讯科技(北京)有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N20/00
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 董文倩;褚敏
地址: 100080 北京市海淀区海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理 方法 装置
【权利要求书】:

1.一种数据处理方法,其特征在于,包括:

在预设场景下,获取输入至神经网络的第一待处理数据,其中,所述神经网络为待更新的模型,所述第一待处理数据包括媒体文件曝光日志中的用户特征和媒体文件特征在组合离散化后的独热编码向量;

通过所述第一待处理数据中位于第一时间窗口内的第一目标数据对所述神经网络进行第一预设次数的迭代训练,得到所述神经网络的种子模型,其中,所述种子模型为所述神经网络的初始化模型;

获取在所述第一时间窗口对应的时间之后产生的第一新增数据,并将所述第一新增数据和所述第一待处理数据合并为第二待处理数据;

通过所述第二待处理数据中位于第二时间窗口内的第二目标数据对所述种子模型进行第二预设次数的迭代训练,得到所述神经网络的第一增量模型,其中,所述第二时间窗口与所述第一时间窗口具有第一预设重叠区域,所述第二预设次数小于等于所述第一预设次数;

将所述第一增量模型进行线上发布,其中,线上发布的所述第一增量模型用于预估媒体文件的点击率。

2.根据权利要求1所述的方法,其特征在于,在将所述第一增量模型进行线上发布之后,所述方法还包括:

根据第一当前时间和所述第二时间窗口确定第三时间窗口,其中,所述第三时间窗口与所述第二时间窗口具有第二预设重叠区域;

获取在所述第二时间窗口对应的时间之后产生的第二新增数据,并将所述第二新增数据和所述第二待处理数据合并为第三待处理数据;

通过所述第三待处理数据中位于所述第三时间窗口内的第三目标数据对所述第一增量模型进行第三预设次数的迭代训练,得到所述神经网络的第二增量模型,其中,所述第三预设次数小于等于所述第一预设次数;

将所述第二增量模型进行线上发布。

3.根据权利要求2所述的方法,其特征在于,根据所述第一当前时间和所述第二时间窗口确定所述第三时间窗口包括:

判断是否有用于推送新模型的指示信息,其中,所述新模型包括所述第二增量模型;

如果判断出有所述指示信息,将所述第一当前时间确定为所述第三时间窗口的右边界,滑动所述第二时间窗口至所述第三时间窗口的右边界,并将所述第三时间窗口的右边界向前推移所述第三时间窗口的长度,得到所述第三时间窗口的左边界,根据所述第三时间窗口的右边界和所述第三时间窗口的左边界确定所述第三时间窗口。

4.根据权利要求1所述的方法,其特征在于,在将所述第一增量模型进行线上发布之后,所述方法还包括:

按照预设周期判断所述第一增量模型中是否存在失效数据,其中,所述失效数据为停止推送的第一待处理数据;

如果按照所述预设周期判断出所述第一增量模型中存在所述失效数据,从所述第一增量模型中清除所述失效数据,得到更新增量模型;

将所述更新增量模型进行线上发布。

5.根据权利要求4所述的方法,其特征在于,从所述第一增量模型中清除所述失效数据,得到所述更新增量模型包括:

将所述第二时间窗口扩大预设倍数,得到第四时间窗口;

获取所述第一增量模型中不在所述第四时间窗口内的第二待处理数据,其中,将所述第一增量模型中不在所述第四时间窗口内的第二待处理数据作为所述失效数据;

从所述第一增量模型中清除所述失效数据,得到所述更新增量模型。

6.根据权利要求5所述的方法,其特征在于,在推送所述更新增量模型上线之后,所述方法还包括:

根据第二当前时间和第四时间窗口确定第五时间窗口,其中,所述第五时间窗口与所述第四时间窗口具有第三预设重叠区域;

获取在所述第四时间窗口对应的时间之后产生的第三新增数据,并将所述第三新增数据和所述第二待处理数据合并为第四待处理数据;

通过所述第四待处理数据中位于所述第五时间窗口内的第四目标数据对所述更新增量模型进行第四预设次数的迭代训练,得到所述神经网络的第三增量模型,其中,所述第四预设次数小于等于所述第一预设次数;

将所述第三增量模型进行线上发布。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610900390.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top