[发明专利]一种基于变分自编码数据融合的网站推荐方法和设备在审
申请号: | 202011249317.0 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112231582A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 李文中;王品皓;余泽鹏;张淋洺;陆桑璐 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958;G06N3/04;G06N3/08 |
代理公司: | 南京泉为知识产权代理事务所(特殊普通合伙) 32408 | 代理人: | 许丹丹 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 数据 融合 网站 推荐 方法 设备 | ||
本发明公开了一种基于变分自编码数据融合的网站推荐方法和设备,所述方法基于协同过滤方法与神经网络、变分自编码器、边信息提取方法,实现了网站推荐,模型构建中将边信息提取与变分自编码器相结合来完成附带排名信息的网站推荐任务,因为提取了隐式反馈数据中的边信息,模型输入的信息更加全面。本发明具有良好的网站推荐效果。
技术领域
本发明涉及神经网络、变分自动编码器、网站推荐、边信息提取,具体涉及一种基于变分自编码器的网站推荐方法。
背景技术
互联网中的信息量不断增大,在网络中过滤信息所需的工作量也随之增大,搜索引擎可以在用户目标明确的情况下帮助用户找到有用信息,推荐系统则根据用户过去的行为去发掘用户可能感兴趣的信息。协同过滤技术被广泛应用到推荐系统中,很多年来协同过滤始终是一个受研究人员关注的研究方向。传统的协同过滤方法可被分为两类,基于近邻的方法和潜在因素模型方法。基于近邻的方法通过提前定义好的相似度计算方法找到用户的或项的近邻,之后基于近邻来进行预测。潜在因素模型的典型方法是矩阵分解方法,该方法将用户和项投影到一个联合向量空间,用代表用户的向量和代表项的向量的内积来表示用户和项的交互信息。近些年随着深度学习的发展,神经网络被应用到推荐系统中,基于神经网络实现的生成模型的目标与协同过滤方法的目标存在着很大的相似性。玻尔兹曼机、自编码器、降噪自编码器以及变分自编码器被研究人员应用到推荐系统中,神经网络将非线性引入到模型中,相比于传统的线性模型,非线性模型具有更强的表达能力,实验结果也显示,非线性模型通常具有更好的表现。然而,根据当前署名发明人的工作发现,已有的基于变分自编码的推荐方法对输入信息进行处理的过程中,其利用的信息仅包含下文提到的交互信息,这造成了很大程度上的信息损失,因此并不能得到优秀的推荐结果。
发明内容
为提升网站推荐系统的表现,本发明提出了基于变分自编码数据融合的网站推荐方法及设备,将提取的边信息融入到输入信息中,在减少输入信息损失的同时,提升了推荐效果。
为了实现上述发明目的,本发明采用如下的技术方案:
根据用户过去的网站浏览记录,来预测用户可能感兴趣的网站,同时提升推荐效果,第一方面,本发明提出一种基于变分自编码数据融合的网站推荐方法,包括以下步骤:
S1、数据的预处理,根据用户的网站浏览信息构建两个二维矩阵,两个矩阵分别是用户和网站的交互矩阵和边信息矩阵;
S2、模型训练,将用户和网站的交互向量和边信息向量拼接起来作为神经网络模型的输入向量,经过损坏处理后输入到神经网络模型,根据变分自编码器的目标函数对神经网络模型进行优化;
S3、模型使用,将目标用户的网站浏览信息转换为交互向量和边信息向量,输入到训练好的变分自编码器模型中,经过编码阶段以及解码阶段获得最终输出,对输出向量各维度的元素进行排序,并移除用户已经访问过的网站对应的元素,利用排名前k的元素对应的网站作为推荐结果。
其中,交互矩阵Y中第u行、第i列的元素yui表示用户u是否访问过网站i,若访问过yui=1,否则yui=0;边信息矩阵R中第u行、第i列的元素rui是用户u访问网站i的相关属性值的加权和,称为边信息。
所述变分自编码器的目标函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011249317.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光纤连接器防尘帽的制备工艺
- 下一篇:摄像模组、制造方法及电子设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置