[发明专利]一种基于生成对抗网络和双聚类的推荐方法及系统在审
申请号: | 201811592917.X | 申请日: | 2018-12-25 |
公开(公告)号: | CN109657149A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 段宝彬;杜振东 | 申请(专利权)人: | 合肥学院;南京云问网络技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 王程远 |
地址: | 230000 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 填充 网络 评价数据 项目组 用户群 对抗 计算机应用技术 读取 集成算法 聚类算法 网络组成 系统利用 低误差 构建 众数 子簇 预测 | ||
1.一种基于生成对抗网络和双聚类的推荐方法,其特征在于,包括以下步骤:
步骤1、读取用户-项目的不完备评价数据集,并对非缺失评价值归一化;
步骤2、根据每一个用户对所有项目的评价数据中是否含有缺失值,将用户划分为不含缺失评价值的完备评价用户和含缺失评价值的不完备评价用户;
步骤3、基于完备评价用户对所有项目归一化后的评价数据矩阵,构建并训练生成对抗网络;
步骤4、利用训练好的生成网络预测和填充归一化后的缺失评价值,得到用户-项目的完备归一化后评价值对应的数据矩阵;
步骤5、基于填充后所有用户对所有项目的归一化后完备评价值数据矩阵,利用双聚类集成算法进行双聚类,从而得到由对应子簇构成的双聚类结果。
步骤6、针对双聚类的每个子簇,向其对应用户群进行关联项目组的推荐,从而提高推荐的效果。
2.根据权利要求1所述的一种基于生成对抗网络和双聚类的推荐方法,其特征在于,所述步骤3的构建并训练生成对抗网络具体如下:
(3-1)利用堆叠降噪自编码器构造生成网络,用用一个二元分类器作为判别网络,组成生成对抗网络;
(3-2)基于完备评价用户的评价数据矩阵训练网络,利用堆叠降噪自编码器重构误差和生成对抗网络的误差之和最小原则确定最优网络参数。
3.根据权利要求1所述的一种基于生成对抗网络和双聚类的推荐方法,其特征在于,所述步骤5中利用双聚类集成算法进行双聚类包括以下步骤:
(5-1)从现有双聚类算法中选择几个适合所有样本完备数据矩阵的双聚类算法作为基聚类算法;
(5-2)基于所有样本的完备数据矩阵,运行每个基聚类算法,得到对应的双聚类结果;
(5-3)比较所有基聚类算法得到双聚类结果对应的子簇,迭代合并相似度较大的双聚类子簇,从而得到最终的双聚类结果。
4.根据权利要求1所述的一种基于生成对抗网络和双聚类的推荐方法,其特征在于,所述步骤(5-3)中迭代合并相似度较大的双聚类子簇,包括以下步骤:
(5-3-1)定义双聚类子簇的相似度,给定最小相似度阈值;
(5-3-2)计算双聚类结果中所有双聚类子簇两两之间的相似度;
(5-3-3)将具有最大相似度且高于最小相似度阈值的两个双聚类子簇进行合并,同时删除对应的小子簇,得到新的双聚类结果;
(5-3-4)反复执行步骤(5-3-2)和(5-3-3),直到没有双聚类子簇合并为止。
5.一种基于生成对抗网络和双聚类的推荐系统,其特征在于,包括以下模块:
评价数据读取模块,用于读取用户-项目的不完备评价数据集,并进行归一化处理;
用户划分模块,用于区分完备评价用户和不完备评价用户;
网络构建和训练模块,用于构建和利用完备评价用户归一化的评价数据集训练生成对抗网络,获得最优的网络参数;
缺失评价值填充模块,用于将具有最优网络参数的生成网络应用到不完备评价用户归一化后缺失评价值的预测和填充中,获得填充后完备的用户-项目归一化评价数据集;
双聚类模块,用于对填充后完备的用户-项目归一化评价数据集进行双聚类集成,得到若干对应的双聚类子簇;
推荐模块,用于向特定用户群推荐对应的项目组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥学院;南京云问网络技术有限公司,未经合肥学院;南京云问网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811592917.X/1.html,转载请声明来源钻瓜专利网。