[发明专利]一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法在审
申请号: | 201710998838.8 | 申请日: | 2017-10-24 |
公开(公告)号: | CN107833070A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 黄梅根;崔文豪;周理含 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06 |
代理公司: | 石家庄轻拓知识产权代理事务所(普通合伙)13128 | 代理人: | 秦燕 |
地址: | 400000 重庆*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 推荐 系统 缓解 数据 稀疏 问题 交叉 动态 填充 方法 | ||
技术领域
本发明属于人工智能领域,涉及一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法。
背景技术
互联网技术的快速发展以及电商平台给人们带来的各种便利,大量电商交易数据随之产生。如何从这些电商数据中挖掘出有价值的信息,进行智能推荐,提高用户的体验,成为我们需要解决的问题。然而,随着推荐系统规模不断扩大,用户评分数据出现极大地稀疏性,给推荐带来相当大地难度,如何对稀疏数据进行填充成为我们首要解决的问题。
发明内容
本发明旨在解决上述问题,提出一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法。
一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法,包括以下步骤:
步骤1,对电商平台数据进行数据预处理;
步骤2,建立用户——商品——评分矩阵;
步骤3,根据构建的用户信息表和商品信息表,分别计算用户相似性及商品相似性;
步骤4,通过用户的相似性、商品的相似性交叉动态填充法对用户——商品——评分矩阵逐步填充。
进一步地,步骤1中所述的电商数据预处理过程如下:
步骤1.1,提取用户相关静态特征和动态交易行为特征,得到用户数据表;
步骤1.2,提取商品相关特征,得到商品信息表;
进一步地,步骤2中所述的构建用户——商品——评分矩阵;
进一步地,步骤3中所述的根据构建的用户信息表和商品信息表,分别计算用户相似性及商品相似性的过程如下:
步骤3.1:用户的相似性计算。通过构建的用户信息表,利用相似性计算的方法,计算出用户之间的相似性,得到用户相似性集合;
步骤3.2:商品相似性计算。通过商品信息表,利用相似性计算方法,计算出商品之间的相似性,得到商品相似性集合;
步骤3.3:将用户相似性集合和商品相似性集合进行合并,将相似性进行降序排序,得到集合;
进一步地,步骤4中所述的数据稀疏性处理:通过用户相似性及商品相似性交叉动态填充法对用户——商品——评分矩阵逐步填充过程如下:
步骤4.1:设置相似性阈值;
步骤4.2:通过用户相似性及商品相似性交叉动态填充方法处理用户——商品——评分矩阵;
步骤4.2.1:通过步骤3.3中的集合,筛选出相似度不小于的集合;
步骤4.2.2:根据集合找到对应的相似用户、相似物品,利用对应的用户相似性、物品相似性填充用户——商品——评分矩阵;
步骤4.2.3:根据上述已经填充的用户——商品——评分矩阵按照步骤3的方法动态计算用户相似性和物品相似性(此时计算相似性所用表为已经填充的用户——商品——评分矩阵);
步骤4.2.4:重复循环步骤4.2.2、4.2.3,直到用户——商品——评分矩阵填充完毕。
有益效果:
与现有推荐系统中数据稀疏性填充方法相比,本发明的优点及有益效果如下:相对单一用户相似性或者单一商品相似性信息填充方法,巧妙地将用户相似性和商品相似性动态结合起来,能够对用户——商品——评分矩阵进行更有效地填充,从而缓解推荐中数据稀疏性问题。以便于对于各个用户进行更精准的推荐,提高用户的个性化体验,促进商家的销售,增加商家收益。
附图说明
图1是用户数据表;
图2是商品数据表;
图3是用户——商品——评分矩阵;
图4是算法流程图;
图5总体框架图。
具体实施方式
以下结合附图和实施例对本发明作进一步的说明。
一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法,包括以下步骤:
步骤1,对电商数据进行数据预处理;
其中,所述的电商数据预处理过程如下:
输入:原始电商数据;
输出:预处理后的专家数据;
步骤1.1,提取用户相关静态特征和动态交易行为特征,得到用户数据表;
如图1所示,用户数据表举例。
步骤1.2,提取商品相关特征,得到商品信息表;
如图2所示,商品信息表举例。
进一步地,步骤2中所述的构建用户——商品——评分矩阵
如图3所示,用户——商品——评分矩阵
步骤3,根据构建的用户信息表和商品信息表,分别计算用户相似性及商品相似性的过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710998838.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置