[发明专利]一种基于元路径的个性化推荐方法及系统在审
申请号: | 201410204492.6 | 申请日: | 2014-05-14 |
公开(公告)号: | CN103955535A | 公开(公告)日: | 2014-07-30 |
发明(设计)人: | 高春华;叶保留;陆桑璐 | 申请(专利权)人: | 南京大学镇江高新技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 212000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 路径 个性化 推荐 方法 系统 | ||
技术领域
本发明涉及一种基于元路径的个性化推荐方法及系统,属于数据挖掘和机器学习的技术领域。
背景技术
随着Web2.0技术和社会化网络的大力发展,越来越多的信息进入人们的日常生活,面对海量的信息,人们越来越难以从中获取有价值的信息。为此,以帮助用户从海量信息中轻松获取有用信息为目标的推荐系统在人们日常生活中扮演着越来越重要的角色。推荐系统主要是根据用户的个人信息和对物品的历史行为,分析用户偏好,跟踪用户兴趣变化,从而实现向用户推荐其感兴趣的相关信息,免去了用户搜索信息的烦恼。主流的推荐系统主要采用基于内容和基于协作过滤的方法。
基于内容的推荐方法是最早被采用的推荐方法,根据文档内容和用户兴趣的相似度进行推荐。由于是根据文档的内容计算相似度,所以产生的推荐结果往往非常具体化,缺少新颖性和多样性。此外,基于内容的推荐方法只适用于具有文档形式的物品推荐,而无法适用于视频音乐等物品推荐要求。
基于协作过滤的推荐方法利用用户与物品之间的关系,计算用户与用户或者物品与物品的相似度,从而根据其最相似邻居的用户或物品来给用户进行推荐。由于此方法只考虑用户与物品的关系并未考虑物品内容,从而降低了推荐精度。
面对传统推荐系统的缺点,如何综合利用基于内容和协作过滤信息来改进推荐算法成了一个有待解决的问题。随着网络不断社会化,用户与用户之间存在着社会关系,如何充分利用用户间社会关系来提高推荐精度同样成为了一个技术问题。传统的推荐系统往往只关注于目标物品类型信息,而忽略了其他物品类型信息对推荐效果的改善,例如,一个电影的推荐系统,用户可能会因为自己喜欢的小说而喜欢此小说改编的电影;也可能会因为自己喜欢的歌手主演的电影。所以,考虑其他非目标物品类型信息能很大程度上增加推荐结果的新颖性和多样性。此外,传统推荐方法很少关注语义对推荐效果的影响,通过引入语义信息,能提高推荐系统的准确度。
因此,有必要提出一种能够综合利用基于内容、协作过滤、社会网络关系,利用其它物品类型对目标物品类型的附加信息,具有语义识别的推荐方法和系统,以有效地提高推荐的准确性、新颖性和多样性。
发明内容
本发明所要解决的技术问题是提供一种基于元路径的个性化推荐方法及系统。本发明基于元路径的概念提供了一种包含基于内容、协作过滤、社会关系等信息的框架,且在此基础上引入了语义特征的概念并融合其他物品对目标物品的附加信息,使得推荐精度更高,物品推荐更加新颖性和多样性。
为了达到上述目的,根据本发明的一方面,本发明提供了一种基于元路径的个性化推荐方法,包括如下步骤:
1)信息获取:获取用户对物品的历史行为信息,用户与用户之间的社会关系和物品自身的内容信息;
2)构建异构网络有向图:基于获取的所有信息构建含有节点类型的异构网络有向图,其中的每一个节点拥有与实际物理类型一致的节点类型;
3)构建概要图:抽象异构网络有向图,只保留节点之间的类型关系,基于异构网路有向图中的节点类型以及节点类型之间的关系构建其概要图;
4)元路径获取:基于概要图,利用广度优先遍历算法,获取含有不同语义的元路径,所述元路径是一个单向路径,其源节点是用户类型,末节点是物品类型,该路径规定了节点遍历的行为和方向,从语义上,不同的元路径对应着不同的语义信息;
5)相关度计算:基于元路径,利用基于异步双向随机游走的相关度计算方法,计算所述元路径下的用户与物品的相关度;
6)生成推荐模型:通过机器学习所述各元路径重要性权值并结合所述元路径生成推荐模型,计算用户对物品的偏好程度;
7)生成推荐项目列表:根据推荐模型预测的用户对未选择物品的偏好程度,以降序方式进行排序,将排在最靠前的一个或多个物品推荐给所述用户。
在上述推荐方法中,所述信息获取步骤包括:若在应用系统中存在用户与用户之间的社会关系,则获取这些信息,若无,则无需获取;用户对资源的历史行为信息并不局限于评分信息,可以是任意其他有用信息,比如用户对某网页的点击次数/对某物品的购买次数。
在上述推荐方法中,在所述信息获取步骤和构建异构网络有向图步骤之间还包括:对用户历史行为数据进行预处理步骤:过滤掉用户对资源否定(不喜欢)的信息,只保留肯定(喜欢)的信息。在用户评分系统中,只保留评分系统内中间分数以上的用户评分为肯定信息。在非评分系统中,用户对网页的点击和对物品的购买,都是肯定的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学镇江高新技术研究院,未经南京大学镇江高新技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410204492.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:开窗机双联变速器齿轮
- 下一篇:一种焦炉交换机交换拉条传动系统