[发明专利]一种基于协同过滤的融合多源异构信息的推荐方法在审
申请号: | 202110336990.6 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113111257A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 魏宇旋;王勇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06F16/33;G06F16/35;G06F40/216;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 过滤 融合 多源异构 信息 推荐 方法 | ||
1.一种基于协同过滤的融合多源异构信息的推荐方法,其特征在于,包括以下步骤:步骤一:确定数据集,根据数据集补全实验中需要的辅助信息;从数据集中获取用户信息数据,项目信息数据和相应的评分数据;生成相应的用户-物品评分文件、用户辅助信息文件以及物品辅助信息文件;
步骤二:对数据集中不同类型数据进行预处理,方便后期使用;
数据预处理具体步骤如下:
将用户辅助信息文件进行预处理;首先数值化个人信息中的非数值字段,对特定范围类型字段进行范围表示;
对物品辅助信息文件限制文本最大长度为500,之后进行数据清洗、分词和停用词过滤,选取关键词汇列表,从原始文档中删除所有不在关键词汇列表中的单词;然后与电影类型一起通过Word2Vec模型进行词嵌入后获得其K维实数向量;
步骤三:数据集的拆分和预处理;将数据集分为训练集,测试集和验证集;使用训练集和测试集训练模型,通过验证集上的实验结果评估算法的预测效果;为防止在训练过程中发生过拟合,在神经网络模型的每个全连接层中设置Dropout为0.3;
步骤四:构建基于协同过滤的推荐模型,该模型分为项目信息抽取模块,用户信息抽取模块和融合推荐模块;
项目信息抽取模块;对于项目j(j∈(1,|V|),|V|为项目数量),对其辅助信息文本预编码后得到项目的内容特征矩阵Tj;门控卷积层包含M个神经元,每个神经元具有一个卷积核和一个用于门控函数的卷积核,特征矩阵Tj经过门控卷积层的第m(m=1,2,3,…,M)个卷积核得到内容特征图zm,如公式(1-1)所示;
其中,*表示卷积操作,Wm和bm为卷积层中第m个神经元的卷积核的参数矩阵和偏置向量;Qm和cm为该神经元用于门控的卷积核的参数矩阵和偏置向量,两个卷积核矩阵维度一致,均为K×P,K为词向量维度,P为一次性提取单词信息的个数;σ为Sigmoid函数,定义为e为自然对数;为按位相乘操作;
之后,通过池化层对M个特征图进行最大值池化操作降维,即在M个特征图中各取一个最大值,并在N维空间进行投影,得到项目j的N维信息深层特征向量tj,N为接下来所有用于推荐的向量的维度,抽取操作通过简化后的公式(1-2)从Tj中得到;
tj=CNN(Wc,Tj) (1-2)
CNN表示门控卷积池化和投影操作,Wc为卷积层中所有卷积核权重和偏置向量组成的参数矩阵;
用户信息抽取模块;首先选取需要处理的用户信息,以用户i(i∈(1,|U|),|U|为用户数量;将数值化后的字段输入到嵌入层得到用户i个人信息的嵌入矩阵Di;
将用户i个人信息嵌入矩阵输入到全连接层,得到用户i的个人信息的N维深层特征向量di;
di=wt·Di+bt (1-3)
其中wt和bt分别是全连接层的权重和偏置的权重参数矩阵;
融合推荐模块;对于用户i,随机生成一个符合高斯分布的N维用户基础特征向量bi;将其与用户信息深层特征向量融合得到用户的综合向量ui,如公式(1-4)所示
ui=bi+di (1-4)
其中di为用户个人信息的深层特征向量;
对于项目j,生成服从于高斯分布的N维项目特征基础向量oj,将其和项目信息深层特征向量融合得到项目综合特征向量vj,如公式(1-5)所示,tj为信息深层特征向量;
vj=oj+tj (1-5)
基于矩阵分解算法,模型的预测评分通过公式(1-6)得到,表示用户i对物品j的预测评分;
步骤五:确定损失函数和参数优化;为了防止模型过拟合,在项目信息抽取模块和用户信息抽取模块都设置了L2正则化约束;本模型中的损失函数L如公式(1-7)所示;
其中,rij为评分矩阵中用户i对物品j的评分,表示用户i对物品j的预测评分;|U|和|V|为用户和物品的数量;λu和λv为用户基础特征向量和物品基础特征向量的正则化系数,λ为神经网络中所有参数的正则化系数,三个正则化系数均为超参数设置为0.02;W为神经网络中所有参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110336990.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种认证方法及装置
- 下一篇:一种高增强型含氟质子或离子交换膜的复合膜