[发明专利]基于属性映射和自动编码神经网络的特征矩阵初始化方法在审
申请号: | 201910416224.3 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110222258A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 赵建立;耿夕娇;肖玉;张沁芝 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 种艳丽 |
地址: | 266590 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物品属性 特征矩阵 矩阵 初始化 属性映射 物品特征 自动编码 维度 矩阵初始化 神经网络 收敛 申请 个性化推荐 矩阵分解 评分矩阵 复杂度 解释性 构建 降维 拟合 向量 算法 | ||
本发明公开了一种基于属性映射和自动编码神经网络的特征矩阵初始化方法,属于个性化推荐领域,本申请首先获取物品属性并构建物品属性矩阵,然后利用物品属性种类来确定物品特征矩阵的维度,同时使用物品属性矩阵对物品特征矩阵初始化,既避免通过多次实验选择维度,又提高了收敛效率;针对传统矩阵分解利用随机值初始化的方法精度低,效率差且可解释性不强的问题,本申请利用物品属性矩阵的值对特征矩阵进行初始化,通过属性映射机制拟合评分矩阵得到物品特征向量,提高了收敛效率;当属性种类较多时,特征矩阵维度较大,本申请使用自动编码技术对使用物品属性矩阵初始化后的特征矩阵进行降维,降低了算法的复杂度。
技术领域
本发明属于个性化推荐领域,具体涉及一种基于属性映射和自动编码神经网络的特征矩阵初始化方法。
背景技术
互联网规模和覆盖面的迅速增长,使得各种终端产生的文本、语音和视频信息在网络中爆发式的汇聚,用户在获取对自己有效信息时,极有可能淹没在信息海洋之中。个性化推荐是目前解决信息超载最有效的工具之一。
推荐算法是个性化推荐的重要组成部分,一般可以分为:基于内容的推荐算法、协同过滤推荐算法、基于知识的推荐算法以及混合推荐算法。协同过滤算法对于推荐系统的发展具有重大意义,主要可分为基于模型的推荐算法和基于内存的推荐算法。基于模型的算法主要利用评分数据建立预测模型,利用模型预测用户对物品的评分,进而产生推荐。矩阵分解算法是基于模型的推荐算法的基础,将用户-物品评分矩阵分解成用户特征矩阵以及物品特征矩阵。目前最常用的矩阵分解方法包括SVD(Singular Value Decomposition)、SVD++(SingularValue Decomposition plus plus)等。特征矩阵初始化是矩阵分解方法的第一步和前提条件,初始化的优劣直接影响到推荐模型的推荐效率和准确性,因此,特征矩阵初始化过程对于预测模型的优劣起着至关重要的作用。
传统的矩阵分解算法在矩阵初始化过程中具有以下问题:
通常使用随机值来初始化特征矩阵,没有实际意义,并且效率低,精度差。
物品特征矩阵的维度需要经过多次实验确定,浪费大量的时间和精力。
发明内容
针对现有技术中存在的上述技术问题,本发明提出了一种基于属性映射和自动编码神经网络的特征矩阵初始化方法,设计合理,克服了现有技术的不足,具有良好的效果。
为了实现上述目的,本发明采用如下技术方案:
一种基于属性映射和自动编码神经网络的特征矩阵初始化方法,首先为便于描述,作如下定义:
U为用户集合,I为物品集合,R为用户-物品评分矩阵,P为用户特征矩阵,Q为物品特征矩阵,rui表示用户u对物品i的评分;
所述的基于属性映射和自动编码神经网络的特征矩阵初始化方法,包括如下步骤:
步骤1:输入物品属性矩阵A、训练数据、学习率γ和正则化参数λ;
步骤2:利用物品属性矩阵A对物品特征矩阵Q进行初始化;
步骤3:利用自动编码技术对物品特征矩阵Q进行降维;
其中,物品属性矩阵Q表示为{x1,x2,…,xi,…,xm};其中,m为物品数量,xi为物品i的高维特征向量,对于xi有:
h(xi;W,b)=σ(Wxi+b) (1);
其中,W是输入层和隐含层的权重,b为输入层的偏置,σ为激活函数;
利用自动编码神经网络降维后的物品特征向量为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910416224.3/2.html,转载请声明来源钻瓜专利网。