[发明专利]基于图卷积技术的推荐系统有效
申请号: | 201811224995.4 | 申请日: | 2018-10-20 |
公开(公告)号: | CN109299373B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 徐亚南;朱燕民;沈艳艳;俞嘉地 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06K9/62 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 技术 推荐 系统 | ||
1.一种基于图卷积技术的推荐系统,其特征在于,包括:预处理模块、异构图生成模块、模型训练模块以及推荐结果生成模块,其中:预处理模块将用户与物品的交互记录进行数据清洗和格式的标准化操作,并对每个用户生成交互序列后输出至异构图生成模块;异构图生成模块根据用户的交互序列数据构建表征用户偏好、物品间依赖关系和用户间相似性的三个异构图并将生成的图结构数据输出至模型训练模块;模型训练模块基于图结构数据训练图卷积模型,并对每个用户和物品生成向量表达;推荐结果生成模块根据向量表达计算用户对所有物品的偏好情况,并生成最终推荐结果;
所述的异构图,通过以下方式生成:构建用户-物品图、物品-物品图和用户-gram图后将三个异构的图合并成一个图,其中:
用户-物品图记录用户和物品之间的交互情况,用于为用户对物品的偏好情况;该图的数学形式为GR=(VU∪VI,ER},其中VU和VI分别为用户和物品节点的集合,为用户和物品节点之间的边的集合,当用户和物品之间有过交互的时候,对应的两个节点之间存在一条边eu,i,边的权重为用户和物品之间交互的次数;设定用户和物品的数量分别为M和N,即|VU|=M和|VI|=N;
物品-物品图记录两个物品在序列数据中相邻的次数,用于为物品和物品在序列数据中的依赖关系或相似关系;该图的数学形式为GI=(VI,EI),其中为物品和物品间边的集合,边的权重为两个物品在序列数据中相邻情况出现的次数;
用户-gram图:用户交互的物品序列,类比成自然语言处理领域的句子;序列中的物品类比成句子中的单词;相应的用户类比成一篇文章;在自然语言处理领域,将文本处理成n-gram的形式,通过比较两个文本的n-gram重叠的程度,来衡量两个文本的相似性;其中n-gram为句子中连续出现的n个单词;该用户-gram图具体为GU=(VU∪VG,EU);其中VG为n-gram节点的集合,|VG|=O;为用户和n-gram节点之间边的集合,边eu,j的权重为用户u的交互序列中出现n-gram节点的次数。
2.根据权利要求1所述系统的实现方法,其特征在于,包括以下步骤:
步骤1、数据预处理:对用户和物品交互的数据进行数据清洗以去除掉可能存在噪声数据,同时将交互的记录整理成相同的格式,并在数据清洗完成后根据记录的时间戳,从而为每个用户生成交互的序列;
步骤2、基于交互序列的异构图构建:将每个用户的序列数据转换成三个异构图,来分别保留用户对物品的偏好、物品间的依赖关系和用户的相似性信息;
步骤3、基于异构图的推荐模型训练:基于构建的三个异构图,通过图卷积推荐系统模型;该模型使用池化和卷积操作,来挖掘图中包含的信息,保留图中节点信息的局部性;在模型训练完成后,该模型为每一个节点生成低维的向量表达,用于最后的推荐结果生成;
步骤4、推荐结果生成:根据图卷积推荐系统模型生成的低维向量表达,针对每个用户,计算其对所有的物品的偏好程度;根据计算的偏好程度,将物品进行排序,就可以得到最终的推荐结果。
3.根据权利要求2所述的方法,其特征是,所述的数据清洗是指:用户与物品交互过程会产生相应的记录,即user,item,time,首先需要对这些交互记录进行清洗,去除一些可能存在的噪声。
4.根据权利要求2所述的方法,其特征是,所述的时间戳是指:针对每个用户所产生的记录,根据时间戳进行排序,形成交互记录的序列数据;当相邻交互记录的时间间隔大于一个设定的阈值,认为前后的序列之间不存在依赖关系,将该交互序列在此处切分成2个子序列;
所述的交互序列是指用户和物品交互记录的时间序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811224995.4/1.html,转载请声明来源钻瓜专利网。