[发明专利]一种歌单多标签推荐方法、系统、设备和存储介质有效
申请号: | 202110316152.2 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113220931B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 王晨旭;郭晨野;杨煜;索凯强;管晓宏 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/635;G06F16/61 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 歌单多 标签 推荐 方法 系统 设备 存储 介质 | ||
1.一种歌单多标签推荐方法,其特征在于,包括以下步骤:
步骤1:采集歌单数据,将歌单数据分为测试集Ltest和训练集Ltrain,使用Min-Hash算法分别将训练集Ltrain中的歌曲信息、歌手信息和用户信息歌单样本降维至N*K维,生成用户-歌单签名矩阵、歌单-歌手签名矩阵和歌单-歌曲签名矩阵;其中,N为歌单集的数量,K为Min-Hash算法中随机置换哈希函数的个数;
步骤2:将用户-歌单签名矩阵、歌单-歌手签名矩阵和歌单-歌曲签名矩阵进行LSH分桶优化,使相似样本分到同一个哈希桶中,并且对训练集Ltrain中的歌曲信息、歌手信息和用户信息的签名矩阵分别进行LSH分桶优化,得到歌单-歌曲哈希桶、歌单-歌手哈希桶与用户-歌单哈希桶;
步骤3:将测试集Ltest中目标歌单的歌曲信息、歌手信息和用户信息分别经过Min-Hash降维后的签名向量输入到对应的歌单-歌曲哈希桶、歌单-歌手哈希桶与用户-歌单哈希桶中进行相似歌单快速检索,得到目标歌单的相似歌单备选集Simset;
步骤4:根据相似歌单备选集Simset以及歌单标签相关度权值计算前z个推荐指标最大的待推荐标签集合RecT;
步骤5:通过FP-Growth算法,将训练集Ltrain中的歌单标签组合LTag进行标签关联规则挖掘,得到标签的关联规则集合rulesT;步骤5的具体过程如下:
步骤6.1:构建项头表,构建空FP树,并扫描训练集Ltrain中的歌单标签组合,对每种标签组合进行计数,根据计数结果,删除支持度低于最小支持度min_supp的标签组合得出第一项频繁项集,将其存入项头表,然后按支持度降序排序;
步骤6.2:二次扫描训练集Ltrain中的歌单标签组合,去除非频繁一项集,按支持度降序排序,得到排好序的频繁项集;
步骤6.3:将步骤6.2中的频繁项集依次插入FP树中;
步骤6.4:通过项头表,递归挖掘频繁项集,并过滤掉不满足最小置信度min_conf的频繁项集,得出关联规则集合:
其中,rulesT表示标签关联规则集合,d表示挖掘到的关联规则总数,Ri表示第i个关联规则;
支持度通过下式计算:
式中,δ(ti,tj)表示歌单标签组合[ti,tj]在Ltrain中标签组合出现的次数,δ(LTag)表示Ltrain中标签组合的总数;supp(ti→tj)表示这个组合的支持度;
置信度通过下式计算:
式中,δ(ti)表示标签ti的总数,conf(ti→tj)表示在标签ti出现的前提下,tj标签会出现的概率;
步骤6:根据满足阈值的标签关联规则集合rulesT,对前z个推荐指标最大的待推荐标签集合RecT中的标签进行重排序,然后选择前A个标签作为目标歌单最终的推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110316152.2/1.html,转载请声明来源钻瓜专利网。