[发明专利]一种知识图谱结合自编码机的电影推荐方法有效
申请号: | 202011470189.2 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112528074B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 李云;朱毅;杨阳 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/783 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;陈栋智 |
地址: | 225000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 结合 编码 电影 推荐 方法 | ||
1.一种知识图谱结合自编码机的电影推荐方法,其特征在于,包括以下步骤:
步骤1从知识图谱DBpedia中获取所有电影的电影语言类别作为额外信息;
步骤2使用multi-hot方法对获得的电影语言类别信息进行向量化表示,作为初始特征扩展;
步骤3使用自编码机对获得的初始特征扩展进行降维,将自编码机的编码层输出作为提取的低维特征表示;
步骤3.1通过公式(1)以及公式(2)完成对自编码机模型进行训练,保留模型参数:
ξl=f(LI·Ql+pl) (1)
L′I=g(ξl·Q′l+p′l) (2)
其中,LI∈Rm×K是m个电影对应的语言类别向量,Ql∈RK×h,Q′l∈Rh×K是自编码机的权值矩阵,pl∈Rh,p′l∈RK是偏置向量,h是自编码机隐藏层的维度,为了避免模型过拟合,使用l2范数对模型参数进行正则化,训练自编码机的目标函数如下所示:
其中表明在训练过程中只考虑有电影语言种类特征的样本;
步骤3.2在模型训练完成后,可通过公式(4)获得LI的低维特征表示,用EI表示低纬特征表示,公式(4)如下所示:
EI=f(LI·Ql+pl) (4);
步骤4将获得的低维特征表示融合到电影的原始特征空间中,并将新的特征作为额外信息输入到半自编码机模型中实现更准确的推荐;
步骤4.1通过步骤3.2获得特征扩展之后,将特征扩展矩阵EI∈Rm×h,所有电影的部分观测评分矩阵rI∈Rm×n以及数据集中自带的额外信息AI∈Rm×y进行拼接,y为额外信息的维度,记为cat(EI,rI,AI)∈Rm×(h+n+y),
步骤4.2将通过步骤4.1得到的cat(EI,rI,AI)作为输入数据输入到半自编码机模型中,通过公式(6)实现:
r′I=f(g(cat(EI,rI,AI)·Q+b)·Q′+b1) (6)
其中Q∈R(h+n+y)×H,Q′∈RH×n是权重矩阵,b∈RH,b1∈Rn是偏置向量,同时半自编码机的隐藏层维度设置为H,同时为了避免模型过拟合,使用l2范数对参数正则化,最终目标函数如公式(7)所示:
步骤4.3最后通过公式(8)获得最终的预测的评分矩阵:
R′=f(g(cat(EI,rI,AI)·Q+b)·Q′+b1) (8)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011470189.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:触屏结构模组及其制作方法、显示装置和电子设备
- 下一篇:一种自助调试系统