[发明专利]一种融合属性和语义的概率矩阵分解冷启动推荐方法有效
申请号: | 201910914274.4 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110851700B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 徐俊;张政;杜宣萱;陶林康;张元鸣 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/18 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 属性 语义 概率 矩阵 分解 冷启动 推荐 方法 | ||
一种融合属性和语义的概率矩阵分解冷启动推荐方法,首先从数据库中提取用户属性信息、项目属性信息、项目文本信息和用户评分信息,利用线性回归对属性信息和语义信息建模预测潜在特征,并把预测值作为概率分解的先验概率,从而实现将属性信息和语义信息融合到评分矩阵的概率分解中。本发明可以有效地将属性信息和语义信息融入到概率矩阵分解中,解决了推荐系统中普遍存在的冷启动和稀疏性问题,并且有更高的准确度,算法复杂度不高,适用处理大规模数据。
技术领域
本发明涉及冷启动推荐领域,特别涉及一种融合属性和语义的概率矩阵分解冷启动推荐方法。
背景技术
随着云计算、大数据、物联网等技术的迅猛发展,使得互联网中的各类服务和用户数据爆炸式增长。这些大数据中蕴含着丰富的价值和巨大潜力,给人类社会带来了变革性的发展,如何快速有效的从纷繁复杂的数据中获取有价值的信息为用户进行个性化的推荐是推荐系统研究的关键难题。个性化推荐系统已经成为学术界和工业界的关注热点并形成了众多相关研究成果。推荐系统是根据用户偏向、兴趣等,通过推荐算法从海量数据中挖掘出用户感兴趣的项目(如信息、服务、物品等),并将结果以个性化列表的形式推荐给用户。目前,推荐系统在很多领域得到了成功应用,包括电子商务、信息检索、社交网络、位置服务、新闻推送等各个领域。
概率矩阵分解技术是根据用户和项目的潜在特征向量以及观察到的评分服从高斯先验分布,利用贝叶斯推导,得到用户和项目的潜在特征矩阵,最后根据潜在特征矩阵计算出预测评分。虽然概率矩阵分解仅采用单一的用户项目评分矩阵进行挖掘,在一定程度上能获得用户和项目的潜在特征,克服了稀疏性问题,但缺乏足够的语义解释,并且不能解决冷启动问题。
目前,学术界对矩阵分解存在的问题已经有所研究,文献1(王阳,钟勇,李振东,etal.融合语义相似度与矩阵分解的评分预测算法[J].计算机应用,2017(z1).)提出一种融合语义相似度的矩阵分解算法,通过本体计算项目间的语义相似度并填充评分矩阵中的缺失值,然后对填充后的评分矩阵分解实现推荐,但是构建本体对象人工代价相对较高,扩展性差。文献2(陈平华,朱禹.融合知识图谱表示学习和矩阵分解的推荐算法[J].计算机工程与设计,2018,39(10):145-150.)提出一种融合知识图谱表示学习和矩阵分解的推荐算法,利用知识图谱计算实体之间的语义相似性,并融入到矩阵分解中,在知识层面上增强了矩阵分解的效果,然而对于新用户或新项目无法完成推荐。文献3(Zhang,Yufang.(2015).Collaborative Filtering Algorithm Based on Item Semantic and UserCharacteristics.Journal of Information and Computational Science.12.4059-4067.10.12733/jics20106139.)提出了结合项目语义与用户特征的协同过滤算法,通过改进的用户相似度和项目相似度线性融合进行预测评分,缓解了冷启动问题,但该方法只是考虑了局部评分数据,忽视了全局影响。
发明内容
针对现有技术的问题,本发明提出了一种融合属性和语义的概率矩阵分解冷启动推荐方法,;利用线性回归对属性信息和语义信息建模预测潜在特征,并把预测值作为概率矩阵分解的先验概率对评分矩阵进行分解;当遇到新用户或新项目时,可以通过属性信息和语义信息有效地预测评分;可以有效地将属性信息和语义信息融入到概率矩阵分解中,解决了推荐系统中普遍存在的冷启动和稀疏性问题,并且有更高的准确度,算法复杂度不高,适用处理大规模数据。
为了实现上述目的本发明采用如下技术方案:
一种融合属性和语义的概率矩阵分解冷启动推荐方法,包括以下步骤:
步骤1.收集大量用户和项目数据,数据包括用户属性信息、项目属性信息、用户对项目的评分信息和项目内容文本信息,以此为基础构建数据集;
步骤2.对项目内容文本信息进行分词、去除停用词预处理,然后对深度学习词向量模型进行训练获得词向量模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910914274.4/2.html,转载请声明来源钻瓜专利网。