[发明专利]一种基于图卷积网络和因子分解机的推荐排序方法及系统在审
申请号: | 202211547787.4 | 申请日: | 2022-12-05 |
公开(公告)号: | CN116108263A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 于敬;刘文海;周明星;陈运文;纪达麒;赛娜 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2457;G06N3/0464;G06N3/045;G06N3/08 |
代理公司: | 上海智力专利商标事务所(普通合伙) 31105 | 代理人: | 杜冰云;周涛 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图卷 网络 因子 分解 推荐 排序 方法 系统 | ||
1.一种基于图卷积网络和因子分解机的推荐排序方法,其特征在于,具体包括以下步骤:
S1,对用户行为数据、用户属性数据和物品属性数据进行预处理;
将预处理后的所有数据按照交互行为发生时间进行降序排序,得到任意用户有过交互的物品集合和任意物品有过交互的用户集合;
S2,利用LightGCN模型对任意用户有过交互的物品集合和任意物品有过交互的用户集合构建用户图结构,得到用户侧的图嵌入表示和物品侧的图嵌入表示;
S3,从预处理后的用户行为数据中得到用户、物品、上下文、交叉这四个维度的特征信息,并将这四个维度的特征信息输入到FM模型,得到用户特征嵌入表示、物品特征嵌入表示、上下文特征嵌入表示和交叉特征嵌入表示;
S4,基于用户侧的图嵌入表示、物品侧的图嵌入表示、用户特征嵌入表示、物品特征嵌入表示、上下文特征嵌入表示和交叉特征嵌入表示进行LightGBM模型的训练和测试,得到训练好的排序学习模型;
训练好的排序学习模型输出待推荐物品候选集并对候选集中各个待推荐物品的分值进行预测,按照分值大小将分值最高的前K个待推荐物品作为最终的推荐结果。
2.根据权利要求1所述的基于图卷积网络和因子分解机的推荐排序方法,其特征在于,步骤S1中对用户行为数据、用户属性数据和物品属性数据进行预处理的步骤为:
依次对用户行为数据、用户属性数据和物品属性数据进行字段类型检查、异常值检查、异常用户过滤、反作弊清洗处理。
3.根据权利要求1或2所述的基于图卷积网络和因子分解机的推荐排序方法,其特征在于,所述用户行为数据指用户在不同业务场景中与物品之间进行过交互行为的数据,包括用户的唯一标识ID、物品的唯一标识ID、交互行为类型、交互行为发生时间;
用户属性数据包括用户的唯一标识ID、年龄、性别、画像标签、职业;
物品属性数据包括物品的唯一标识ID、物品标题、物品类别、物品被打上的标签。
4.根据权利要求3所述的基于图卷积网络和因子分解机的推荐排序方法,其特征在于,所述交互行为类型包括点击、点赞、播放、购买。
5.根据权利要求1所述的基于图卷积网络和因子分解机的推荐排序方法,其特征在于,步骤S3中从预处理后的用户行为数据中得到的用户、物品、上下文、交叉这四个维度的特征信息分别为:
用户维度的特征信息包括用户的人口统计学信息、画像标签、用户统计特征;
物品维度的特征信息包括物品属性和物品统计特征;
上下文维度的特征信息包括情境相关特征和情境统计特征;
交叉维度的特征信息包括单一特征的组合统计信息。
6.根据权利要求1所述的基于图卷积网络和因子分解机的推荐排序方法,其特征在于,步骤S4中基于用户侧的图嵌入表示、物品侧的图嵌入表示、用户特征嵌入表示、物品特征嵌入表示、上下文特征嵌入表示和交叉特征嵌入表示进行LightGBM模型的训练和测试的具体步骤为:
将所有的用户侧的图嵌入表示和物品侧的图嵌入表示与用户特征嵌入表示、物品特征嵌入表示、上下文特征嵌入表示和交叉特征嵌入表示进行特征拼接得到完整特征表示;
将所有的完整特征表示按照一定比例随机分成训练集和测试集,对LightGBM模型进行训练和测试,不断调整LightGBM模型的参数,得到训练好的排序学习模型。
7.根据权利要求6所述的基于图卷积网络和因子分解机的推荐排序方法,其特征在于,LightGBM模型的参数包括树的深度、迭代次数、正则化项系数。
8.一种基于图卷积网络和因子分解机的推荐排序系统,其特征在于,包括数据预处理模块、图嵌入向量生成模块、特征向量生成模块和排序学习模型训练和预测模块,
所述数据预处理模块,用于对用户行为数据、用户属性数据和物品属性数据进行预处理,并从预处理后的数据中得到任意用户有过交互的物品集合和任意物品有过交互的用户集合;
所述图嵌入向量生成模块,用于利用LightGCN模型对任意用户有过交互的物品集合和任意物品有过交互的用户集合构建用户图结构,得到用户侧的图嵌入表示和物品侧的图嵌入表示;
所述特征向量生成模块,利用FM模型对从预处理后的用户行为数据中得到用户、物品、上下文、交叉这四个维度的特征信息进行一阶和二阶维度的交叉学习,得到用户特征嵌入表示、物品特征嵌入表示、上下文特征嵌入表示和交叉特征嵌入表示;
所述排序学习模型训练和预测模块,基于用户侧的图嵌入表示、物品侧的图嵌入表示、用户特征嵌入表示、物品特征嵌入表示、上下文特征嵌入表示和交叉特征嵌入表示对LightGBM模型进行训练和测试,对待推荐候选集进行分值预测,按照分值大小排序选取TopK作为最终的推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211547787.4/1.html,转载请声明来源钻瓜专利网。