[发明专利]一种基于自编码机和聚类的混合推荐方法有效
申请号: | 201810135027.X | 申请日: | 2018-02-09 |
公开(公告)号: | CN108491431B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 朱全银;赵阳;胡荣林;李翔;严云洋;冯万利;周泓;王啸;瞿学新;潘舒新 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/9032;G06F16/906;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
地址: | 223003 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 混合 推荐 方法 | ||
发明公开了一种基于自编码机和聚类的混合推荐方法,本发明将用户评分数据和用户人口统计学数据结合,经过归一化处理,再利用自编码机提取用户特征数据,接着使用K‑means++聚类方法对用户聚类,当用户有推荐需求时,将待推荐用户的评分数据和人口统计学数据结合,归一化处理后再利用自编码机提取待推荐用户特征,再使用K‑means++聚类方法对待推荐用户分类,最后使用最适合该类别的推荐方法对用户进行推荐。本发明弥补了现有推荐方法在稀疏矩阵上表现不佳的状况,有效的提高了推荐的准确性。
技术领域
本发明属于特征提取和推荐方法技术领域,特别涉及一种基于自编码机和聚类的混合推荐方法。
背景技术
随着信息技术不断地发展,互联网上的信息发生了指数型的增长,用户无法快速的在网上寻找到自己想要的信息,这就是“信息过载”问题。学术界和工业界都在不断地探索提高信息服务质量解决“信息过载”问题的方法,由此诞生了个性化推荐技术。近年来针对不同的推荐系统的需求,研究者提出了相应的个性化推荐方案,如基于内容推荐,协同过滤,关联规则,效用推荐,组合推荐等。
朱全银等人已有的研究基础包括:朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取算法[J].淮阴工学院学报,2015,24(5):18-24;李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;Quanyin Zhu,Sunqun Cao.ANovel Classifier-independent Feature Selection Algorithm for ImbalancedDatasets.2009,p:77-82;Quanyin Zhu,Yunyang Yan,Jin Ding,Jin Qian.The CaseStudy for Price Extracting of Mobile Phone Sell Online.2011,p:282-285;QuanyinZhu,Suqun Cao,Pei Zhou,Yunyang Yan,Hong Zhou.Integrated Price Forecast basedon Dichotomy Backfilling and Disturbance Factor Algorithm.InternationalReview on Computers and Software,2011,Vol.6(6):1089-1093;朱全银等人申请、公开与授权的相关专利:朱全银,胡蓉静,何苏群,周培等.一种基于线性插补与自适应滑动窗口的商品价格预测方法.中国专利:ZL 2011 1 0423015.5,2015.07.01;朱全银,曹苏群,严云洋,胡蓉静等,一种基于二分数据修补与扰乱因子的商品价格预测方法.中国专利:ZL 20111 0422274.6,2013.01.02;朱全银,尹永华,严云洋,曹苏群等,一种基于神经网络的多品种商品价格预测的数据预处理方法.中国专利:ZL 2012 1 0325368.6;李翔,朱全银,胡荣林,周泓.一种基于谱聚类的冷链物流配载智能推荐方法.中国专利公开号:CN105654267A,2016.06.08;曹苏群,朱全银,左晓明,高尚兵等人,一种用于模式分类的特征选择方法.中国专利公开号:CN 103425994 A,2013.12.04;朱全银,严云洋,李翔,张永军等人,一种用于文本分类和图像深度挖掘的科技情报获取与推送方法.中国专利公开号:CN 104035997 A,2014.09.10;朱全银,辛诚,李翔,许康等人,一种基于K-means和LDA双向验证的网络行为习惯聚类方法.中国专利公开号:CN 106202480 A,2016.12.07。
自编码机:
自编码机(Autoencoder)是一种无监督学习算法,它由三层网络组成,其中输入层与输出层神经元数量相等,隐藏层神经元数量少于输入输出层。自编码机将输入的特征经过非线性变化到隐藏层上,通过这种方法,可以降低特征的维度,提高了计算效率。
K-means++聚类方法:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810135027.X/2.html,转载请声明来源钻瓜专利网。