[发明专利]基于知识图谱的推荐算法性能优化的方法在审
申请号: | 202011455909.8 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112417306A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王钰蓥;王勇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 推荐 算法 性能 优化 方法 | ||
本发明涉及基于知识图谱的推荐算法性能优化的方法,解决推荐系统可解释性、缓解冷启动并提高算法准确性的方法。首先解决算法的可解释性问题:通过对原始数据集进行预处理,构建知识图谱,利用知识图谱元路径提取技术得到路径信息,输入到循环神经网络GRU中,并添加注意力机制和平均池化层,对不同路径进行重要性区分,得出模型预测向量。其次缓解算法的冷启动问题:对用户和物品的节点属性信息进行相乘,得出属性融合向量。将两部分向量结果以3:7的比例进行结合,利用交叉熵损失函数对模型进行训练,得出预测结果。经实验得出:与基于GRU模型的推荐算法相比,算法的准确性提高2.3%,与传统矩阵分解模型相比,准确性提高5.1%。
技术领域
本专利涉及将知识图谱的路径信息和结点的内容信息进行融合,从而提高推荐算法准确率和召回率的方法,属于知识图谱和推荐系统相关技术领域。
背景技术
近年来,随着网络信息技术的不断发展,人们可以方便的从各种渠道获取到丰富的信息。但与此同时,人们也面临着信息过载的问题,很难从海量的数据中准确快速的找到自己想要的信息。在这种情况下,个性化推荐算法应运而生。个性化推荐可以利用高效的互联网工具,为人们提供准确的服务,从而帮助用户从海量的信息中个性化的提取有用的信息,以此来满足用户的需求。推荐系统可以在用户无明确需求的情况下,根据用户的历史行为数据,挖掘其中的规律,从而为每个用户个性化的提供其感兴趣的信息。在用户使用的同时,推荐系统还可以及时的记录下每个用户的行为数据,从而为后续的推荐提供数据来源。
推荐系统的核心当属推荐算法,目前推荐算法的研究有很多种,其中协同过滤推荐算法是目前学术界研究最广泛的模型,被广大研究者所应用。该算法主要是针对已有的用户和物品信息,对当前用户最有可能感兴趣的物品来进行预测。主要可分为基于邻居的算法和基于模型的算法两大类。基于邻居的算法主要是根据与目标预测用户相似的其他用户偏好来进行推荐,通过计算不同用户及物品之间的相似度进行推荐的一种方法。而基于模型的算法则是将用户-物品评分矩阵转化为不同的模型,通过模型的建立和调优来进行预测。但该算法在推荐的过程中会受到可解释性、稀疏性、冷启动等诸多制约因素的影响,因此在推荐算法的研究过程中,缓解传统协同过滤推荐算法中的各个问题成为目前研究的重点。
伴随着推荐系统的发展,大多数研究者开始致力于研究通过混合多种推荐算法来解决推荐的可解释性、数据稀疏以及冷启动等问题。目前机器学习和深度学习的蓬勃发展也为推荐系统提供了优化思路,同时基于知识图谱的推荐也逐渐被研究者所关注。
基于知识图谱的推荐算法主要是以现有的推荐模型为基础,将知识图谱中关于物品、用户等实体的结构化知识加入到推荐模型当中,通过引入额外的知识来改善早期推荐模型中的数据稀疏问题。目前多是利用知识图谱表示学习来获取知识图谱中推荐物品的相关信息,并对该向量进行降维处理,得到知识的低维稠密矩阵,最终完成推荐。但缺点在于无法确定在不同场景下数据和关系的规模,并且未能解决算法的可解释性和冷启动等问题。因此,在基于知识图谱的推荐算法的性能优化上还值得进一步的探讨和研究。
发明内容
本发明旨在提供一种利用用户-物品评分矩阵构建知识图谱,从而根据知识图谱结点的连接性得到每位用户的路径偏好信息,并融合各结点的内容信息来进行推荐的一种方法。
与现有技术的区别在于:1.模型方面:现有技术多是单纯利用知识图谱元路径提取将结点信息进行叠加或单纯利用知识图谱表示技术来将结点信息嵌入到向量中,没有将知识图谱的元路径与知识的具体结点信息相结合来进行推荐预测。2.可解释性方面:现有模型多是利用模型来提升预测的准确性,深度学习模型的缺陷是针对数据进行学习,但无法对模型预测结果进行解释,很难在可解释性上做分析。该模型针对各用户的不同类型偏好进行学习,从而弥补了模型可解释性的问题,使推荐结果的可解性增强。3.冷启动方面:现有技术针对模型的准确率和冷启动问题多是采用模型的dropout来随机丢弃部分结点特征,从而提高模型的鲁棒性,本模型将对模型的修改与多部分结点的属性信息相结合,共同解决冷启动问题,效果得到提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011455909.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种转体桥梁设备
- 下一篇:基于无源积分的直流微电网改进下垂控制方法