[发明专利]数据处理方法、装置和计算机可读存储介质在审
申请号: | 202011584595.1 | 申请日: | 2020-12-28 |
公开(公告)号: | CN113761435A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 陈东东;易津锋;周伯文 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06N3/04;G06N3/08 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李昊;刘剑波 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 可读 存储 介质 | ||
1.一种数据处理方法,包括:
将新品的特征数据输入到预先训练的特征提取网络中,获得所述特征提取网络的最后一层输出的、所述新品的输出参考特征,其中,所述特征提取网络是基于特征提取损失函数训练的,所述特征提取损失函数是基于所述特征提取网络的多个层的输出数据的最大均值差异匹配结果、以及用于分辨所述输出参考特征来源的判别网络的判别结果构建的;
将所述输出参考特征输入到预先训练的机器学习模型中,获得所述机器学习模型输出的、所述新品的用户交互指数。
2.根据权利要求1所述的数据处理方法,其中,在所述特征提取损失函数中,所述生成网络的多个层的输出数据的最大均值差异匹配结果是根据用于训练的新品的中间参考特征、与所述用于训练的新品的关联品的中间参考特征的差距确定的,所述中间参考特征为将特征数据输入到特征提取网络中后,所述特征提取网络的中间层输出的特征。
3.根据权利要求1所述的数据处理方法,其中,在所述特征提取损失函数中,所述生成网络的判别网络的判别结果是根据所述判别网络对用于训练的新品的输出考特征、与所述用于训练的新品的关联品的输出参考特征的来源判别的正确性确定的。
4.根据权利要求1所述的数据处理方法,其中,所述机器学习模型是根据所述机器学习模型对非新品的用户交互指数的预测结果、与所述非新品的实际用户交互指数之间的差距训练的。
5.根据权利要求1~4中任一项所述的数据处理方法,其中,所述特征数据包括相应物品的属性特征以及环境特征,所述环境特征包括所述物品的一个或多个关联品的集合对应的用户交互指数。
6.根据权利要求1~4中任一项所述的数据处理方法,其中,所述用户交互指数包括点击量、浏览量、收藏量、下单量中的至少一种。
7.一种用于数据处理的训练方法,包括:
将用于训练的新品的特征数据输入到特征提取网络中,获得所述特征提取网络的多个中间层输出的、所述用于训练的新品的中间参考特征,以及获得所述特征提取网络的最后一层输出的、所述用于训练的新品的输出参考特征;
将新品关联品的特征数据输入到特征提取网络中,获得所述特征提取网络的多个中间层输出的、所述关联品的中间参考特征,以及获得所述特征提取网络的最后一层输出的、所述关联品的输出参考特征;
将所述新品的输出参考特征和所述关联品的输出参考特征输入到判别网络中,获得所述判别网络对输入的参考特征的来源的判别结果;
根据所述用于训练的新品的中间参考特征与所述关联品的中间参考特征的差距、以及所述判别网络的判别结果,确定所述特征提取网络的损失值;
根据所述损失值对所述特征提取网络的参数进行调整。
8.根据权利要求7所述的训练方法,其中,所述特征数据包括相应物品的属性特征以及环境特征,所述环境特征包括所述物品的一个或多个关联品的集合对应的用户交互指数。
9.一种数据处理装置,包括:
特征提取模块,被配置为将新品的特征数据输入到预先训练的特征提取网络中,获得所述特征提取网络的最后一层输出的、所述新品的输出参考特征,其中,所述特征提取网络是基于特征提取损失函数训练的,所述特征提取损失函数是基于所述特征提取网络的多个层的输出数据的最大均值差异匹配结果、以及用于分辨所述输出参考特征来源的判别网络的判别结果构建的;
用户交互指数获得模块,被配置为将所述输出参考特征输入到预先训练的机器学习模型中,获得所述机器学习模型输出的、所述新品的用户交互指数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011584595.1/1.html,转载请声明来源钻瓜专利网。