[发明专利]基于日志挖掘的商品推荐方法、装置、服务器及存储介质有效
申请号: | 201811247722.1 | 申请日: | 2018-10-24 |
公开(公告)号: | CN109300014B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 孙翀;吕琴艳;帖军;王江晴;艾勇;吴立锋 | 申请(专利权)人: | 中南民族大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/2458 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 日志 挖掘 商品 推荐 方法 装置 服务器 存储 介质 | ||
本发明公开了一种基于日志挖掘的商品推荐方法、装置、服务器及存储介质。本发明引入事务数据库,对事务数据库进行频繁项集挖掘,并设计一种新的商品相似度计算方式,然后将相似度计算结果与Pearson相关系数进行加权综合,缓解了数据稀疏性导致共同评分项过少而出现的相似度度量不准确的问题,从而更准确寻找最近邻集合并进行推荐,克服了协同过滤算法在计算项目的相似度时过度依赖用户对项目的评分数据的问题。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于日志挖掘的商品推荐方法、装置、服务器及存储介质。
背景技术
伴随着互联网和信息技术的迅猛发展,网络上的信息数据量呈指数增长,人们逐渐陷入“信息过载”时代,在这个时代,消费者很难从众多商品中找到自己感兴趣的商品,同时生产者也很难让自己的商品在众多用户的关注中脱颖而出。推荐系统则成为解决该问题的重要手段。它可以根据用户的喜好筛选不相关的项目,并推荐用户可能喜欢的项目。
虽然协同过滤算法取得了巨大的成功,但始终存在数据稀疏性问题。电子商务网站中用户和项目的数目非常庞大,而多数用户只会对少量的项目进行评分,导致用户之间评分的重叠部分很小,难以计算两个用户之间的相似程度。而协同过滤算法在计算相似度时完全依赖用户对项目的评分数据,未考虑项目间相互关联的特性。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于日志挖掘的商品推荐方法、装置、服务器及存储介质,旨在解决现有技术中协同过滤算法在计算相似度时完全依赖用户对项目的评分数据,未考虑项目间相互关联的特性的技术问题。
为实现上述目的,本发明提供一种基于日志挖掘的商品推荐方法,所述方法包括以下步骤:
从各用户的购买日志中提取各用户的购买记录,并根据各用户的购买记录建立事务数据库;
根据预设最小支持度通过Apriori算法对所述事务数据库进行逐条扫描,获得各频繁项集,并根据各频繁项集构成频繁项集矩阵;
根据所述频繁项集矩阵确定综合相似度矩阵;
获取目标用户的未评分商品,并将所述未评分商品作为待测商品;
基于所述综合相似度矩阵对所述待测商品进行预测评分;
根据预测评分结果确定待推送商品,并将待推送商品推送至所述目标用户的用户设备。
优选地,所述根据所述频繁项集矩阵确定综合相似度矩阵,具体包括:
根据所述频繁项集矩阵计算所述频繁项集中各商品之间的相似度;
根据所述频繁项集矩阵以及各用户对商品的评分计算Pearson相关系数的绝对值;
根据所述频繁项集中各商品之间的相似度以及Pearson相关系数的绝对值确定综合相似度矩阵。
优选地,根据各频繁项集之间的相似度以及Pearson相关系数的绝对值通过下式确定综合相似度矩阵,
其中,Si,j为综合相似度矩阵中商品i和商品j之间的综合相似度,为权重,S1i,j为所述频繁项集中商品i和商品j之间的相似度,S2i,j为商品i和商品j之间的Pearson相关系数的绝对值。
优选地,根据所述频繁项集矩阵通过下式计算所述频繁项集中各商品之间的相似度,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811247722.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成信息的方法和装置
- 下一篇:一种分布式架构电商平台管理系统