[发明专利]一种数据处理方法、装置及存储介质有效
申请号: | 201910086094.1 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109829063B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 梁超;崔瑞;李天浩 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/438;G06F16/48 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 存储 介质 | ||
本发明实施例公开一种数据处理方法、装置及存储介质,其中,方法包括:当向第一用户推荐多个第一多媒体数据时,记录每个第一多媒体数据与所述第一用户之间的数据推送关系,并基于每个数据推送关系以及每个第一多媒体数据携带的目标字符串,确定第一报表信息;当检测到多个第一多媒体数据中的目标多媒体数据对应的触发指令时,根据触发指令记录第一用户与所述目标多媒体数据之间的数据触发关系,并基于数据触发关系以及目标多媒体数据携带的目标字符串,确定第二报表信息;基于第一报表信息、第二报表信息,获取训练样本集,并基于训练样本集对历史预测模型进行训练,得到目标预测模型。采用本发明,可以确保模型训练的准确性。
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据处理方法、装置及存储介质。
背景技术
现有的推荐系统通常具有候选集生成模块和点击率预估模块,其中,点击率预估模块可以用于预估用户点击一个内容的概率,即可以通过在线预测的方式得到该内容对应的内容点击率。
其中,内容点击率的影响因素可以包括用户的喜好、不同用户对某个内容的点击率、展现形式、内容素材等特征,因此,当这些特征的特征值产生变化时,比如,一个视频的内容素材(如标题)或者点击率产生变化时,会导致该在线预测所采用的特征(在线预测时所采用的特征可以称之为在线特征)和后续对模型进行离线训练所采用的特征(模型训练时所采用的特征可以称之为离线特征)不一致,进而无法确保模型训练的准确性,以至于无法准确筛选出符合用户喜好的内容。
发明内容
本发明实施例提供一种数据处理方法、装置及存储介质,可以确保在线特征和离线特征的一致性,进而可以确保模型训练的准确性。
本发明实施例一方面提供了一种数据处理方法,所述方法应用于应用服务器,包括:
当向第一用户推荐多个第一多媒体数据时,记录每个第一多媒体数据与所述第一用户之间的数据推送关系,并基于每个数据推送关系以及所述每个第一多媒体数据携带的目标字符串,确定第一报表信息;所述每个目标字符串为表征目标时刻下的所述第一用户和相应第一多媒体数据的字符串;
当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时,根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系,并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串,确定第二报表信息;
基于所述第一报表信息、所述第二报表信息,获取训练样本集,并基于所述训练样本集对历史预测模型进行训练,得到目标预测模型;所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率。
其中,所述方法还包括:
将所有注册用户中每个注册用户的用户注册特征、用户历史行为特征分别确定为所述每个注册用户的用户状态特征;
当检测到针对所有注册用户中的第一用户与目标应用所对应的数据点击指令;
基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据;
将筛选出的所有待推荐多媒体数据确定为第一多媒体数据,并将每个第一多媒体数据推荐给所述第一用户。
其中,所述基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据,包括:
基于所述数据点击指令从多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的多媒体数据添加至第一候选数据集,并将所述第一候选数据集中每个多媒体数据分别确定为第二媒体数据;
基于历史预测模型、每个第二多媒体数据的物品特征以及所述第一用户的用户状态特征,对所述每个第二多媒体数据进行预测,得到所述每个第二多媒体数据对应的第一预测概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910086094.1/2.html,转载请声明来源钻瓜专利网。