[发明专利]一种歌单多标签推荐方法、系统、设备和存储介质有效

专利信息
申请号: 202110316152.2 申请日: 2021-03-24
公开(公告)号: CN113220931B 公开(公告)日: 2023-01-03
发明(设计)人: 王晨旭;郭晨野;杨煜;索凯强;管晓宏 申请(专利权)人: 西安交通大学
主分类号: G06F16/65 分类号: G06F16/65;G06F16/635;G06F16/61
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 安彦彦
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 歌单多 标签 推荐 方法 系统 设备 存储 介质
【权利要求书】:

1.一种歌单多标签推荐方法,其特征在于,包括以下步骤:

步骤1:采集歌单数据,将歌单数据分为测试集Ltest和训练集Ltrain,使用Min-Hash算法分别将训练集Ltrain中的歌曲信息、歌手信息和用户信息歌单样本降维至N*K维,生成用户-歌单签名矩阵、歌单-歌手签名矩阵和歌单-歌曲签名矩阵;其中,N为歌单集的数量,K为Min-Hash算法中随机置换哈希函数的个数;

步骤2:将用户-歌单签名矩阵、歌单-歌手签名矩阵和歌单-歌曲签名矩阵进行LSH分桶优化,使相似样本分到同一个哈希桶中,并且对训练集Ltrain中的歌曲信息、歌手信息和用户信息的签名矩阵分别进行LSH分桶优化,得到歌单-歌曲哈希桶、歌单-歌手哈希桶与用户-歌单哈希桶;

步骤3:将测试集Ltest中目标歌单的歌曲信息、歌手信息和用户信息分别经过Min-Hash降维后的签名向量输入到对应的歌单-歌曲哈希桶、歌单-歌手哈希桶与用户-歌单哈希桶中进行相似歌单快速检索,得到目标歌单的相似歌单备选集Simset

步骤4:根据相似歌单备选集Simset以及歌单标签相关度权值计算前z个推荐指标最大的待推荐标签集合RecT

步骤5:通过FP-Growth算法,将训练集Ltrain中的歌单标签组合LTag进行标签关联规则挖掘,得到标签的关联规则集合rulesT;步骤5的具体过程如下:

步骤6.1:构建项头表,构建空FP树,并扫描训练集Ltrain中的歌单标签组合,对每种标签组合进行计数,根据计数结果,删除支持度低于最小支持度min_supp的标签组合得出第一项频繁项集,将其存入项头表,然后按支持度降序排序;

步骤6.2:二次扫描训练集Ltrain中的歌单标签组合,去除非频繁一项集,按支持度降序排序,得到排好序的频繁项集;

步骤6.3:将步骤6.2中的频繁项集依次插入FP树中;

步骤6.4:通过项头表,递归挖掘频繁项集,并过滤掉不满足最小置信度min_conf的频繁项集,得出关联规则集合:

其中,rulesT表示标签关联规则集合,d表示挖掘到的关联规则总数,Ri表示第i个关联规则;

支持度通过下式计算:

式中,δ(ti,tj)表示歌单标签组合[ti,tj]在Ltrain中标签组合出现的次数,δ(LTag)表示Ltrain中标签组合的总数;supp(ti→tj)表示这个组合的支持度;

置信度通过下式计算:

式中,δ(ti)表示标签ti的总数,conf(ti→tj)表示在标签ti出现的前提下,tj标签会出现的概率;

步骤6:根据满足阈值的标签关联规则集合rulesT,对前z个推荐指标最大的待推荐标签集合RecT中的标签进行重排序,然后选择前A个标签作为目标歌单最终的推荐结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110316152.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top