[发明专利]一种基于层次化物品协同过滤推荐方法有效
申请号: | 201910830873.8 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110688583B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 张新;王东京;俞东进 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 物品 协同 过滤 推荐 方法 | ||
本发明公开了一种基于层次化物品协同过滤推荐方法,包括以下步骤:收集用户对物品的行为数据以及物品的元数据;对收集的行为数据和物品的元数据进行建模和物品相似度计算;基于层次化物品协同过滤的推荐。本发明主要是利用多种数据,包括用户对物品的行为数据和物品的元数据信息,以此计算物品之间的相似度并实施基于层次化物品协同过滤的推荐,缓解数据稀疏和冷启动问题的影响,进而改进推荐结果的准确率和多样性。
技术领域
本发明属于数据挖掘及推荐技术领域,具体涉及一种基于层次化物品协同过滤推荐方法。
背景技术
推荐系统能够帮助用户从海量在线内容中找到相关项目来降低搜索成本,而准确计算物品的相似度是实现个性化推荐系统的核心之一。然而,传统方法通常遭受诸如推荐精度低、推荐效果类似等问题,无法满足用户的需求。协同过滤推荐算法能够利用用户和物品之间的行为数据实施推荐,在一定程度上提高了推荐的准确率和用户的满意率。然而,现有协同过滤方法无法充分利用内容数据,且面临冷启动和数据稀疏等问题。因此,如何充分包括用户的细粒度行为数据和物品的内容数据在内的丰富信息,是改进推荐系统的准确性、推荐结果多样性以及用户满意度的关键之一。
发明内容
针对现有技术所存在的上述技术问题,本发明提供了一种基于层次化物品协同过滤推荐方法,能够改善推荐的效果和性能。
本发明包括如下内容:
1、一种基于层次化物品协同过滤推荐方法,包括如下步骤:
10.收集用户对物品的行为数据以及物品的元数据;
20.对收集的行为数据和物品元数据进行建模并计算物品之间的相似度;
30.基于层次化物品协同过滤的推荐。
其中步骤10包括:
101.收集所有用户的行为数据U={u1,u2,...,u|U|}为所有用户的集合,用户u∈U的历史行为数据为Hu={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合。
102.收集I中所有物品的元数据M,包括但不限于类别、属性、标签等信息。
其中步骤20包括:
201.将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话。以用户u∈U为例,其历史行为数据可以根据时间划分为用户u的第n个会话定义为
202.根据上述数据分别构建物品-用户索引表、物品-会话索引表和物品-元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系。
203.根据用户的行为数据以及物品的元数据,计算物品之间的相似度,其计算公式为:
sim(i,j)=α·simu(i,j)+β·sims(i,j)+γ·simm(i,j)
其中,i,j∈I,α、β和γ是对应相似度的权重;
是物品在用户层的相似度,Ui和Uj是分别与物品i和j的有交互行为的用户集合,根据物品-用户索引表获得,|U|是集合U的大小;
是物品在用户层的相似度,Si和Sj是分别包含物品i和j的会话集合,根据物品-会话索引表获得;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910830873.8/2.html,转载请声明来源钻瓜专利网。