[发明专利]数据处理方法、装置和计算机可读存储介质在审
申请号: | 202011584595.1 | 申请日: | 2020-12-28 |
公开(公告)号: | CN113761435A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 陈东东;易津锋;周伯文 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06N3/04;G06N3/08 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李昊;刘剑波 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种数据处理方法、装置和计算机可读存储介质,涉及数据处理领域。数据处理方法包括:将新品的特征数据输入到预先训练的特征提取网络中,获得特征提取网络的最后一层输出的、新品的输出参考特征,其中,特征提取网络是基于特征提取损失函数训练的,特征提取损失函数是基于特征提取网络的多个层的输出数据的最大均值差异匹配结果、以及用于分辨输出参考特征来源的判别网络的判别结果构建的;将输出参考特征输入到预先训练的机器学习模型中,获得机器学习模型输出的、新品的用户交互指数。通过在特征提取网络的训练中引入多层迁移学习,降低了新品的属性分布与历史的新品属性分布的差异问题,提高了新品的信息预测的准确性。
技术领域
本发明涉及数据处理领域,特别涉及一种数据处理方法、装置和计算机可读存储介质。
背景技术
在相关技术中,存在预先确定用户交互指数的需求,用户交互指数例如包括电商网站中物品的点击量、浏览量、销量等等。通过预测这些信息,可以提前预判网络的负载情况、仓储压力情况以及订单生成过程中带来的计算资源消耗情况。
在相关技术中,可以采用以下几种确定方法。一种为德尔菲法,这种方法通过聚合几个专家经验,得出预测结果。另一种为时间序列预测,这种方式通过历史数据进行预测。再一种是机器学习模型预测,这种方式综合考虑物品属性、物品的预测信息的历史信息等数据进行预测。
发明内容
发明人经过分析后发现,相关技术中的预测方法大多是解决已上线一段时间的物品的信息预测。然而,对于未来要上线的新品,目前并没有成熟的预先确定用户交互指数的方法。
本发明实施例所要解决的一个技术问题是:如何更准确地预先确定新品的用户交互指数。
根据本发明一些实施例的第一个方面,提供一种数据处理方法,包括:将新品的特征数据输入到预先训练的特征提取网络中,获得特征提取网络的最后一层输出的、新品的输出参考特征,其中,特征提取网络是基于特征提取损失函数训练的,特征提取损失函数是基于特征提取网络的多个层的输出数据的最大均值差异匹配结果、以及用于分辨输出参考特征来源的判别网络的判别结果构建的;将输出参考特征输入到预先训练的机器学习模型中,获得机器学习模型输出的、新品的用户交互指数。
在一些实施例中,在特征提取损失函数中,生成网络的多个层的输出数据的最大均值差异匹配结果是根据用于训练的新品的中间参考特征、与用于训练的新品的关联品的中间参考特征的差距确定的,中间参考特征为将特征数据输入到特征提取网络中后,特征提取网络的中间层输出的特征。
在一些实施例中,在特征提取损失函数中,生成网络的判别网络的判别结果是根据判别网络对用于训练的新品的输出考特征、与用于训练的新品的关联品的输出参考特征的来源判别的正确性确定的。
在一些实施例中,机器学习模型是根据机器学习模型对非新品的用户交互指数的预测结果、与非新品的实际用户交互指数之间的差距训练的。
在一些实施例中,特征数据包括相应物品的属性特征以及环境特征,环境特征包括物品的一个或多个关联品的集合对应的用户交互指数。
在一些实施例中,用户交互指数包括点击量、浏览量、收藏量、下单量中的至少一种。
根据本发明一些实施例的第二个方面,提供一种用于数据处理的训练方法,包括:将用于训练的新品的特征数据输入到特征提取网络中,获得特征提取网络的多个中间层输出的、用于训练的新品的中间参考特征,以及获得特征提取网络的最后一层输出的、用于训练的新品的输出参考特征;将新品关联品的特征数据输入到特征提取网络中,获得特征提取网络的多个中间层输出的、关联品的中间参考特征,以及获得特征提取网络的最后一层输出的、关联品的输出参考特征;将新品的输出参考特征和关联品的输出参考特征输入到判别网络中,获得判别网络对输入的参考特征的来源的判别结果;根据用于训练的新品的中间参考特征与关联品的中间参考特征的差距、以及判别网络的判别结果,确定特征提取网络的损失值;根据损失值对特征提取网络的参数进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011584595.1/2.html,转载请声明来源钻瓜专利网。