[发明专利]一种基于Apriori算法的图书推荐方法和系统在审
申请号: | 201810696747.3 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109033202A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 程阳;章韵 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联规则 历史数据 图书借阅 图书推荐 分布式文件系统 数据存储平台 存储 关联规则挖掘 相似特征 用户界面 用户推荐 关联性 准确率 数据库 转化 分析 | ||
1.一种基于Apriori算法的图书推荐方法,其特征在于:包括如下步骤:
步骤1:获取数据库中的图书借阅历史数据,并将其存入分布式文件系统中;
步骤2:基于Apriori算法对分布式文件系统中的图书借阅历史数据进行关联规则挖掘,得到具体的强关联规则;
步骤3:将步骤2中获得的强关联规则存储到数据存储平台;
步骤4:将存储在数据存储平台中的强关联规则转化为用户界面形式。
2.根据权利要求1所述的基于Apriori算法的图书推荐方法,其特征在于:所述Apriori算法为基于分布式计算框架并在归约阶段设置多个归约程序来进行计算的Apriori算法。
3.根据权利要求1所述的基于Apriori算法的图书推荐方法,其特征在于:所述数据存储平台为HBase数据库。
4.一种基于Apriori算法的图书推荐系统,其特征在于:包括图书借阅历史数据模块、数据预处理模块、关联规则挖掘模块和图书推荐模块;
所述图书借阅历史数据模块用于存储用户的图书借阅历史数据;
所述数据预处理模块用于对用户的图书借阅历史数据进行数据清洗和数据格式转化;
所述关联规则挖掘模块用于基于Apriori算法对用户的图书借阅历史数据进行关联规则挖掘,并得到强关联规则;
所述图书推荐模块用于与所述关联规则挖掘模块进行交互,将所述强关联规则转换为用户界面形式。
5.根据权利要求4所述的基于Apriori算法的图书推荐系统,其特征在于:所述数据预处理模块与数据库交互,用于对用户的图书借阅历史数据进行数据清洗,并将用户的图书借阅历史数据转化为适合进行关联规则挖掘的数据格式。
6.根据权利要求4所述的基于Apriori算法的图书推荐系统,其特征在于:所述关联规则挖掘模块由剪枝模块、分布式计算模块和分布式存储模块构成。
7.根据权利要求6所述的基于Apriori算法的图书推荐系统,其特征在于:所述剪枝模块用于对算法迭代的数据集范围进行剪枝。
8.根据权利要求6所述的基于Apriori算法的图书推荐系统,其特征在于:所述分布式计算模块用于将数据预处理模块得到的数据在分布式文件系统上进行关联规则挖掘,并得到强关联规则。
9.根据权利要求8所述的基于Apriori算法的图书推荐系统,其特征在于:所述分布式存储模块用于存储所述分布式计算模块得到的强关联规则。
10.根据权利要求9所述的基于Apriori算法的图书推荐系统,其特征在于:所述图书推荐模块用于与所述分布式存储模块进行交互,将存储在所述分布式存储模块中的所述强关联规则转换为用户界面形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810696747.3/1.html,转载请声明来源钻瓜专利网。