[发明专利]一种基于社会化卷积矩阵分解的文档上下文感知推荐方法在审
申请号: | 201810076808.6 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108287904A | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 徐光侠;何李杰;刘俊;马创;常光辉;解绍词;陶荆朝 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵分解 文档 上下文感知 目标用户 特征向量 卷积 向量 卷积神经网络 联合概率分布 上下文特征 上下文信息 高斯噪声 函数预测 链接关系 评分信息 无缝集成 物品描述 信任关系 兴趣爱好 学习过程 捕获 好友 概率 优化 | ||
1.一种基于社会化卷积矩阵分解的文档上下文感知推荐方法,其特征在于,包括以下步骤:
S1:收集用户的基本信息数据集X,并进行了预处理;
S2:将原始的文档上下文信息通过卷积神经网络(CNN)架构中的嵌入层转换为数字矩阵D;
S3:利用S2生成的数字矩阵D,通过卷积层提取出上下文权重W;并提取出具有代表性的特征,通过构建固定长度特征向量的池操作来处理可变长度的文档;
S4:经过S2,S3得到的每个文档的潜在向量Sj作为平均值可以得到项目的潜在特征向量;
S5:通过计算其好友的潜在特征向量的平均值可以得到目标用户的潜在特征向量;
S6:经过贝叶斯推断可以得到用户和项目的联合概率分布,最后可以综合利用那些与目标用户之间具有信任关系的用户的评分以及项目的文档上下文信息进行推荐。
2.根据权利要求1所述一种基于社会化卷积矩阵分解的文档上下文感知推荐方法,其特征在于:步骤S1所述用户的基本信息数据集X为:X=[用户对项目的评分矩阵、用户属性、项目的描述文档、用户的好友集合、用户的信任关系集合]。
3.根据权利要求1所述一种基于社会化卷积矩阵分解的文档上下文感知推荐方法,其特征在于:步骤S2所述原始的文档上下文信息转换数字矩阵D为:
S21:嵌入层将原始文档转换成表示下一个卷积层的文档的密集数字矩阵。详细地说,关于该文件作为l个单词的序列,我们通过连接文档中的单词的向量来将文档表示为矩阵。
S22:然后将单词向量随机初始化或初始化用训练前的单词嵌入模型,通过优化过程进一步训练单词向量。然后,文档矩阵变成:
其中l是文档的长度,p表示每个词wi的嵌入维数的大小。
4.根据权利要求1所述一种基于社会化卷积矩阵分解的文档上下文感知推荐方法,其特征在于:步骤S3所述上下文权重W计算过程为:
S31:通过第j个共享权重来提取上下文特征其中,窗口大小ws确定了周围词的数量:
其中,*是一个卷积运算符,是Wcj的一个偏差,f是是非线性激活函数。
S32:我们使用不饱和非线性的神经元为修正线性单元ReLU(Rectified LinearUnits)来避免梯度消失的问题,导致优化收敛速度慢,并可能导致局部最小值。然后,具有Wcj文档的上下文向量为:
其中每个上下文特征向量具有可变长度(即,l-ws+1上下文特征)。
S33:一个共享权重捕捉一种类型的上下文特征。因此,我们使用多个共享权重来捕获多种类型的上下文特征,这使得我们能够生成与Wc的数量nc具有相同的上下文特征向量。(即Wcj,其中j=1,2,…,nc)。
S34:我们利用max-pooling,通过从每个上下文特征向量中提取最大上下文特征,将文档的表示形式减少为nc固定长度向量。
其中cj是由第j个共享权重Wcj提取的长度l-ws+1的上下文特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810076808.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种与投影相结合的搜题方法及智能笔
- 下一篇:一种网络流特征的提取与存储方法