[发明专利]基于双塔结构模型的数据处理方法和装置有效
申请号: | 202110671455.6 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113362139B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 胡凯雨 | 申请(专利权)人: | 震坤行工业超市(上海)有限公司 |
主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601;G06N3/048;G06N3/082;G06N3/084;G06F18/214 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 201105 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 结构 模型 数据处理 方法 装置 | ||
本发明提供一种基于双塔结构模型的数据处理方法,双塔结构模型包括用户塔和商品塔,方法包括:获取用户信息、商品信息以及用户对商品的行为信息;对用户信息和商品信息分别进行索引处理,得到用户索引数据和商品索引数据,并对行为信息进行时间衰减处理,得到时间衰减行为数据;将数据中的一部分数据划分为训练数据;将训练数据中的用户索引数据输入用户塔,将训练数据中的商品索引数据输入商品塔,得到用户塔输出的用户向量以及商品塔输出的商品向量,并且将用户向量以及商品向量输入用户塔和商品塔之后的similarity层和sigmoid层,得到sigmoid层输出的预测数据;将训练数据中的时间衰减行为数据和预测数据输入模型训练函数,得到训练后的双塔结构模型。
技术领域
本发明涉及基于双塔结构模型的数据处理方法、装置、存储介质和系统。
背景技术
目前,对于推荐召回的方法一方面是基于传统算法,比如使用用户协同过滤(User-user collaborative filtering),根据用户找其相似用户,推荐相似用户的常用商品。商品协同过滤(Item-item collaborative filtering),向用户推荐其之前常用的商品相似的商品;关联规则,找到商品经常一起出现在购买列表中的商品。但是,上述方法都是寻找用户对商品历史行为中去找关联商品/相似商品,但是对于上线的新品,无法进行推荐,且没有结合商品的品牌,类目,价格等信息与用户的信息。因此,当商品开始变多,用户行为逐渐丰富起来时,上述几种算法难以挖掘到更深层次的用户和商品之间的关系。
发明内容
为了解决上述问题,本发明提供了一种基于双塔结构模型的数据处理方法,所述双塔结构模型包括用户塔和商品塔,所述方法包括:
获取用户信息、商品信息以及用户对商品的行为信息;
对所述用户信息和所述商品信息分别进行索引处理,得到用户索引数据和商品索引数据,并对所述行为信息进行时间衰减处理,得到时间衰减行为数据;
将所述用户索引数据、所述商品索引数据和所述时间衰减行为数据中的一部分数据划分为训练数据;
将所述训练数据中的用户索引数据输入所述用户塔,将所述训练数据中的商品索引数据输入所述商品塔,得到所述用户塔输出的用户向量以及所述商品塔输出的商品向量,并且将所述用户向量以及所述商品向量输入所述用户塔和所述商品塔之后的similarity层和sigmoid层,得到sigmoid层输出的预测数据;
将所述训练数据中的时间衰减行为数据和所述预测数据输入模型训练函数,得到训练后的双塔结构模型。
其中,所述训练后的双塔结构模型包括训练后的用户塔以及多个训练后的商品向量,当新用户的新用户信息输入所述训练后的用户塔后,基于所述多个训练后的商品向量,获得多个新用户预测数据。
其中,根据以下函数对所述行为信息进行时间衰减处理,
其中yinit-i表示第i个行为信息,di表示第i个行为信息发生时间和第i个行为信息处理时间之间的时间差,α为常量,ymax,ymin分别表示yi中的最大值与最小值,yNi表示第i个行为信息的时间衰减行为数据。
其中,在所述similarity层中,根据以下函数进行计算,
并且在所述sigmoid层中,根据以下函数得到预测数据,
表示第j个用户向量,表示第j个商品向量,yj′表示第j个预测数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于震坤行工业超市(上海)有限公司,未经震坤行工业超市(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110671455.6/2.html,转载请声明来源钻瓜专利网。