[发明专利]数据处理方法及系统、计算机系统和计算机可读存储介质在审
申请号: | 201810616843.2 | 申请日: | 2018-06-14 |
公开(公告)号: | CN110610392A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 徐邵稀 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q10/04 |
代理公司: | 11021 中科专利商标代理有限责任公司 | 代理人: | 吕雁葭 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 向量集 隐含 预测评估模型 神经网络 计算机可读存储介质 目标函数生成 数据处理系统 目标函数 误差优化 样本数据 输出 数据处理 计算机系统 评估 预测 优化 | ||
本公开提供了一种数据处理方法,包括:根据第一样本数据确定第一向量集和第二向量集;将第一向量集中的每一个第一向量输入第一神经网络,输出第一隐含因子向量;将第二向量集中的每一个第二向量输入第二神经网络,输出第二隐含因子向量;根据第一隐含因子向量集的误差和第二隐含因子向量集的误差优化目标函数;以及根据优化后的目标函数生成预测评估模型,其中,预测评估模型用于预测用户对产品的评估值。本公开还提供了一种数据处理系统、一种计算机系统和一种计算机可读存储介质。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种数据处理方法及系统、一种计算机系统和一种计算机可读存储介质。
背景技术
随着网络的迅速发展,使得信息量呈爆炸式地增长,为避免用户浏览大量无关的信息和产品,个性化推荐应运而生。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和产品。个性化推荐系统能建立在海量数据挖掘基础上,帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。给定用户对产品的历史评估记录或行为,预测用户对新产品的评估值,是个性化推荐系统的典型模式之一。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:
相关技术中训练得到的预测评估模型的准确率低,导致个性化推荐效果差。
发明内容
有鉴于此,本公开提供了一种数据处理方法及系统、一种计算机系统和一种计算机可读存储介质。
本公开的一个方面提供了一种数据处理方法,包括根据第一样本数据确定第一向量集和第二向量集,其中,上述第一样本数据包括多个用户对不同产品的评估值,上述第一向量集中的每一个第一向量表征同一用户对不同产品的评估值,上述第二向量集中的每一个第二向量表征多个用户对同一产品的评估值;将上述第一向量集中的每一个第一向量输入第一神经网络,输出第一隐含因子向量,其中,每一个第一向量具有对应的第一隐含因子向量,一个或多个第一隐含因子向量组成第一隐含因子向量集;将上述第二向量集中的每一个第二向量输入第二神经网络,输出第二隐含因子向量,其中,每一个第二向量具有对应的第二隐含因子向量,一个或多个第二隐含因子向量组成第二隐含因子向量集;根据上述第一隐含因子向量集的误差和上述第二隐含因子向量集的误差优化目标函数;以及根据优化后的目标函数生成预测评估模型,其中,上述预测评估模型用于预测用户对产品的评估值。
根据本公开的实施例,上述方法还包括根据上述第一样本数据生成评估矩阵,其中,上述评估矩阵中的每一个元素表征用户对产品的评估值;将上述评估矩阵分解成第一矩阵和第二矩阵,其中,上述第一矩阵包括多个第三隐含因子向量,每一个第三隐含因子向量表征对应用户的隐含因子向量,上述第二矩阵包括多个第四隐含因子向量,每一个第四隐含因子向量表征对应产品的隐含因子向量;以及根据上述第一隐含因子向量集的误差和上述第二隐含因子向量集的误差优化目标函数包括:根据上述第一隐含因子向量和上述第三隐含因子向量之间的第一差值与上述第二隐含因子向量和上述第四隐含因子向量之间的第二差值优化上述目标函数。
根据本公开的实施例,上述方法还包括根据第二样本数据确定第三向量集和第四向量集,其中,上述第二样本数据包括多个用户的用户信息和多种产品的产品信息,上述第三向量集中的每一个第三向量表征同一用户的用户信息,上述第四向量集中的每一个第四向量表征同一产品的产品信息;将上述第一向量集中的每一个第一向量输入第一神经网络,输出第一隐含因子向量包括:将第一向量和相应的第三向量一起输入上述第一神经网络,输出第五隐含因子向量;将上述第二向量集中的每一个第二向量输入第二神经网络,输出第二隐含因子向量包括:将第二向量和相应的第四向量一起输入上述第二神经网络,输出第六隐含因子向量;以及根据上述第一隐含因子向量集的误差和上述第二隐含因子向量集的误差优化目标函数包括根据上述第五隐含因子向量和上述第三隐含因子向量之间的第三差值与上述第六隐含因子向量和上述第四隐含因子向量之间的第四差值优化上述目标函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810616843.2/2.html,转载请声明来源钻瓜专利网。