[发明专利]一种融合自动编码器和知识图谱语义信息的推荐方法有效
申请号: | 201910293428.2 | 申请日: | 2019-04-12 |
公开(公告)号: | CN109992674B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 陈涛;刘学军;孙鑫 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535;G06F18/2413;G06F18/214;G06N3/048 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 朱少华 |
地址: | 210009 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 自动 编码器 知识 图谱 语义 信息 推荐 方法 | ||
本发明提出了一种融合自动编码器和知识图谱语义信息的推荐方法,包括以下步骤:获取项目数据集,并对其进行预处理;所述项目数据集包括用户、主题、评分和项目名称;训练自动编码器,并利用训练后的自动编码器对预处理后的项目数据集进行训练,构建初始用户特征表示;利用word2vec模型训练后的数据获得用户的缺失主题的权重,计算用户特征的强化表示;从用户中任选一用户作为目标用户,基于用户特征的强化表示采用KNN获得与目标用户的相似用户进行推荐。本发明为神经网络中的隐藏层提供了解释性意义,在准确率、召回率、F值推荐性能指标方面有着良好的表现。
技术领域
本发明涉及数据分析领域,具体涉及一种融合自动编码器和知识图谱语义信息的推荐方法。
背景技术
移动互联网的迅速发展为人们的生活带来便利的同时,还带来了信息过载问题。在信息过载的今天,人们做出有效的选择变得十分困难。推荐系统旨在解决信息过载的问题,为用户找到一组满足他们个性化兴趣的物品。推荐系统发展至今,人们已经提出了许多高效的算法和模型来解决推荐问题。传统推荐算法主要分为:协同过滤算法(Collaborative Filtering)、基于内容的推荐(Content-based)、混合推荐。协同过滤算法考虑了用户的历史交互,并根据用户潜在的共同偏好进行推荐,取得了巨大的成功。然而,基于协同过滤的方法通常受到用户—项目交互的稀疏性和冷启动问题的影响。为了解决这些局限性,研究人员建议将辅助信息合并到协同过滤算法中,比如社交网络、用户/项目属性、图像和上下文。与协同过滤算法不同,基于内容的推荐算法利用特征表示性元数据来查找与用户历史评价的项目中类似项目,并相应地推荐它们。
研究表明,将两种策略结合在一个混合推荐算法中,推荐质量可以得到改善。基于内容的算法需要获取项目的相关信息,以便对其相应的特性建模。在这个方向上,近年来知识图谱被广泛应用于表征、计算其相似性和相关性,以及为基于内容的推荐和混合推荐提供数据。知识图谱以关联开放数据(LOD)数据集的形式供大众免费获取使用,为知识感知的推荐系统在许多应用领域的发展铺平了道路。
发明内容
本发明提出了一种融合自动编码器和知识图谱语义信息的推荐方法,包括以下步骤:获取项目数据集,并对其进行预处理;所述项目数据集包括用户、主题、评分和项目名称;
训练自动编码器,并利用训练后的自动编码器对预处理后的项目数据集进行训练,构建初始用户特征表示;
利用word2vec模型训练后的数据获得用户的缺失主题的权重,计算用户特征的强化表示;
从用户中任选一用户作为目标用户,基于用户特征的强化表示采用KNN算法获得与目标用户的相似用户进行推荐。
进一步地,所述预处理包括过滤无用数据,使用查询语句从知识库中获取项目的相关联主题。
进一步地,所述训练自动编码器包括以下步骤:
使用矩阵M来训练自动编码器,其中的行和列分别代表项目名称i和特征f;
其中
计算自动编码器的隐藏层h和输出层o,具体计算公式为:
h=g(X×(W·M))
o=g(h×(R·MT))
其中,g为Sigmoid函数,X是评分矩阵,W是输入层与隐藏层之间的权值矩阵,R是隐藏层与输出层之间的权值矩阵。
进一步地,所述将预处理后的项目数据集通过训练后的自动编码器训练后得到输出评分矩阵Y,具体训练步骤包括:
所述用户用u表示;
对W和R按照均方误差损失计算梯度E:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910293428.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识图谱生成方法、装置、设备及可读存储介质
- 下一篇:信息处理方法和装置