[发明专利]一种歌单多标签推荐方法、系统、设备和存储介质有效

申请号：	202110316152.2	申请日：	2021-03-24
公开（公告）号：	CN113220931B	公开（公告）日：	2023-01-03
发明（设计）人：	王晨旭;郭晨野;杨煜;索凯强;管晓宏	申请（专利权）人：	西安交通大学
主分类号：	G06F16/65	分类号：	G06F16/65;G06F16/635;G06F16/61
代理公司：	西安通大专利代理有限责任公司 61200	代理人：	安彦彦
地址：	710049 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种歌单多标签推荐方法系统设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种歌单多标签推荐方法，其特征在于，包括以下步骤：

步骤1：采集歌单数据，将歌单数据分为测试集L_test和训练集L_train，使用Min-Hash算法分别将训练集L_train中的歌曲信息、歌手信息和用户信息歌单样本降维至N*K维，生成用户-歌单签名矩阵、歌单-歌手签名矩阵和歌单-歌曲签名矩阵；其中，N为歌单集的数量，K为Min-Hash算法中随机置换哈希函数的个数；

步骤2：将用户-歌单签名矩阵、歌单-歌手签名矩阵和歌单-歌曲签名矩阵进行LSH分桶优化，使相似样本分到同一个哈希桶中，并且对训练集L_train中的歌曲信息、歌手信息和用户信息的签名矩阵分别进行LSH分桶优化，得到歌单-歌曲哈希桶、歌单-歌手哈希桶与用户-歌单哈希桶；

步骤3：将测试集L_test中目标歌单的歌曲信息、歌手信息和用户信息分别经过Min-Hash降维后的签名向量输入到对应的歌单-歌曲哈希桶、歌单-歌手哈希桶与用户-歌单哈希桶中进行相似歌单快速检索，得到目标歌单的相似歌单备选集Sim_set；

步骤4：根据相似歌单备选集Sim_set以及歌单标签相关度权值计算前z个推荐指标最大的待推荐标签集合Rec_T；

步骤5：通过FP-Growth算法，将训练集L_train中的歌单标签组合L_Tag进行标签关联规则挖掘，得到标签的关联规则集合rules_T；步骤5的具体过程如下：

步骤6.1：构建项头表，构建空FP树，并扫描训练集L_train中的歌单标签组合，对每种标签组合进行计数，根据计数结果，删除支持度低于最小支持度min_supp的标签组合得出第一项频繁项集，将其存入项头表，然后按支持度降序排序；

步骤6.2：二次扫描训练集L_train中的歌单标签组合，去除非频繁一项集，按支持度降序排序，得到排好序的频繁项集；

步骤6.3：将步骤6.2中的频繁项集依次插入FP树中；

步骤6.4：通过项头表，递归挖掘频繁项集，并过滤掉不满足最小置信度min_conf的频繁项集，得出关联规则集合：

其中，rules_T表示标签关联规则集合，d表示挖掘到的关联规则总数，R_i表示第i个关联规则；

支持度通过下式计算：

式中，δ(t_i,t_j)表示歌单标签组合[t_i,t_j]在L_train中标签组合出现的次数，δ(L_Tag)表示L_train中标签组合的总数；supp(t_i→t_j)表示这个组合的支持度；

置信度通过下式计算：

式中，δ(t_i)表示标签t_i的总数，conf(t_i→t_j)表示在标签t_i出现的前提下，t_j标签会出现的概率；

步骤6：根据满足阈值的标签关联规则集合rules_T，对前z个推荐指标最大的待推荐标签集合Rec_T中的标签进行重排序，然后选择前A个标签作为目标歌单最终的推荐结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安交通大学，未经西安交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110316152.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种锻压轮毂用铝合金的生产工艺
下一篇：一种基于编码和缓存的跨层联合的视频传输方法、系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种歌单多标签推荐方法、系统、设备和存储介质有效

专利文献下载