[发明专利]一种融合人格特质和物品标签的单分类协同过滤方法有效
申请号: | 201810033637.9 | 申请日: | 2018-01-11 |
公开(公告)号: | CN108109058B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 孙见山;徐东;姜元春;刘业政;孙春华;任德源;刘雅珏 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 人格 特质 物品 标签 分类 协同 过滤 方法 | ||
本发明公开了一种融合人格特质和物品标签的单分类协同过滤方法,包括:首先基于用户人格特质计算用户间的相似度,根据其相似度计算用户对物品的偏好程度;然后基于物品标签计算用户对物品的偏好程度;紧接着融合基于人格的用户对物品的偏好和基于物品标签的用户对物品的偏好得到用户对物品的总偏好程度,利用其总偏好程度构建矩阵分解模型;最后根据模型进行推荐。本发明使用人格特质和物品标签作为额外的信息来识别出缺失数据中混合在一起的正例和负例,从而有效地解决数据稀疏问题和新用户冷启动问题,继而提高个性化推荐的精度。
技术领域
本发明属于电子商务领域,具体地说是一种融合人格特质和物品标签的矩阵分解方法(PTMF)。
背景技术
随着信息技术的发展、信息资源的膨胀以及电子商务的迅速发展,对于用户来说,寻找自己感兴趣的商品信息已经成为一件困难且昂贵的阻碍;对于各大电商企业来说,如何有效提高用户的购买率成为了他们首要考虑的问题。推荐系统通过给用户提供满足用户需求个性化的物品、产品或服务能够很好的客服这个阻碍。协同过滤技术是个性化推荐应用最早也是最为成功的技术之一,它能够很好地基于物品或用户之间的相似性对用户的购买决策提供技术支撑。协同过滤在亚马逊购物网、Netflix电影租赁网站以及lastFM社交音乐网站等得到了扩展和实际的应用。近年来协同过滤的算法在国内外得到了广泛的扩展和研究,按照处理数据的不同主要分为两类:一类是有明确的偏好数据,如评分;另一类则是隐性数据,如点击,购买。这种隐性反馈的数据广泛存在于真实世界的应用场景中,由于不需要用户提供明确的评分,因此比评分等显性数据更容易获取。对于隐性反馈数据,该类数据中仅有正例是可以明确知道的,负例是不确定的,故称这类问题为单分类协同过滤问题。单分类协同过滤的任务就是通过分析这些隐性数据来针对特定用户的偏好进行个性化推荐。以用户听歌的数据为例,这些数据中用户听过的歌曲构成的数据可以解释为正例,其余缺失数据是负例和漏掉的正例的混合。现有的研究虽然为单分类协同过滤问题提供了基础理论支撑和实践指导但仍存在着诸多的问题:
(1)数据稀疏性问题
在实际的场景中,用户真实购买的产品在整个产品的目录中的占比很少。尤其对单分类协同过滤来说,只有用户对产品的正例是可获得的,而不是用户的评分,如表1所示:
表1
因此利用传统的协同过滤,根据这些正例来计算物品或者用户之间的相似度显然是不合理的。而且缺失的数据很多情况下并不是代表用户不喜欢该产品,而是由于某些限制用户无法关注到这些产品,这些潜在的有用信息没有得到有效利用,这会更一步加剧数据稀疏性问题。
(2)新用户冷启动问题
所谓的新用户冷启动问题就是当一个推荐系统面对新来的用户(新注册用户)的时候,由于没有该用户历史的兴趣偏好等行为记录,导致推荐系统无法精准地进行个性化推荐。如表2所示,u5和u6两个用户没有相关的行为记录,因此无法根据传统的协同过滤技术来进行推荐:
表2
发明内容
本发明为了克服现有单分类协同过滤存在的不足之处,提出了一种融合人格特质和物品标签的单分类协同过滤方法,以期使用人格特质和物品标签作为额外的信息来识别出缺失数据中混合在一起的正例和负例数据,从而有效地解决数据稀疏问题和新用户冷启动问题,继而提高个性化推荐的精度。
为了达到上述目的,本发明所采用的技术方案为:
本发明一种融合人格特质和物品标签的单分类协同过滤方法的特点是按照如下步骤进行:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810033637.9/2.html,转载请声明来源钻瓜专利网。