[发明专利]一种基于FP-growth的歌曲推荐方法在审
申请号: | 201810877202.2 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109299313A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 宋耀莲;田榆杰;龙华;王慧东;徐文林;武双新 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/61 | 分类号: | G06F16/61;G06F16/635 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联规则 频繁项集 歌曲 歌曲推荐 次扫描 置信度 事务 标识符 列表数据库 频繁模式 数据挖掘 音乐类型 用户匹配 用户账号 舒适性 构建 算法 排序 集合 保留 | ||
本发明涉及一种基于FP‑growth的歌曲推荐方法,属于数据挖掘推荐技术领域。先建立一个用户在听歌软件上的歌曲列表数据库,用户账号作为标识符TID,对应的歌曲列表作为一个事务T,所有事务的集合为事务集D;对D进行第一次扫描,计算并保留频繁项歌曲;然后,对D进行第二次扫描,构建频繁模式树FP‑tree,并提取出频繁项集;其次,由各频繁项集产生相应的强关联规则,并计算出各强关联规则的置信度大小;最后,通过各强关联规则的置信度大小,将这些频繁项集进行推荐排序。本发明与现有技术相比,主要提供了FP‑growth算法对用户所喜欢音乐类型的相似歌曲起到推荐作用,提高用户匹配到喜欢歌曲的效率,同时也增强了听歌软件为用户带来的听歌舒适性。
技术领域
本发明涉及一种基于FP-growth的歌曲推荐方法,属于数据挖掘推荐技术领域。
背景技术
在现代,音乐的种类多种多样,音乐的数量也非常庞大,胜有一种百花齐放、百家争鸣之景。然而,就是由于现代音乐的迅猛发展,使得人们即便在喜好音乐类型中也很难找到自己钟意的歌曲。
FP-growth算法是韩家炜等人在2000年提出的关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息。在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-growth算法基于以上的结构加快整个挖掘过程。而且算法已经被广泛的应用到商业、网络安全等各个领域,但还没有应用到音乐领域。
发明内容
本发明要解决的技术问题是提供一种基于FP-growth的歌曲推荐方法,将FP-growth算法应用到听歌软件中根据用户的歌单来推荐给用户可能喜好的歌曲曲目,提高用户匹配到喜欢歌曲的效率,同时也增强了听歌软件为用户带来的听歌舒适性。
本发明的技术方案是:一种基于FP-growth的歌曲推荐方法,包括如下步骤:
Step1、建立一个用户在听歌软件上的歌曲列表数据库,用户账号作为标识符TID,对应的歌曲列表作为一个事务T,所有事务的集合为事务集D;
Step2、对D进行第一次扫描,计算每一个事务T中各项歌曲的支持度计数support_count_x,设置一个最小支持度阈值min_sup,support_count_x≥min_sup的歌曲作为频繁项保留,反之剔除,然后将频繁项按照支持度计数降序排列;
Step3、对事务集D进行第二次扫描,每读入一个事务T时,创建标记为其歌曲的节点,然后形成根节点null到歌曲节点的路径,直到每个事务都映射到FP-tree的一条路径,读入所有事务后形成FP-tree;
Step4、从FP-tree的每条路径的结尾节点依次向上提取出相应的项集,项集的支持度计数support_count_xj大于等于min_sup时,该项集作为频繁项集l保留,反之剔除;
Step5、设置一个最小置信度阈值min_conf;每个频繁项集l所产生的每个非空子集为s,若子集(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强关联规则该强规则的置信度大小为l与s的支持度计数之比的值
Step6、将所计算出来的所有强关联规则按照其置信度confidence的大小进行排序,当输入一个歌曲时,通过关联规则得出与该歌曲相关联的其他歌曲。
具体地,所述步骤Step1中,歌曲列表数据库中每条信息包含用户账号字段及列表中的歌曲字段,用户账号作为标识符TID,对应歌曲列表作为一个事务T,所有事务的集合为D,每一首歌曲作为一个项。
具体地,所述步骤Step2中,最小支持度阈值min_sup的大小由用户根据自己的需求自行设置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810877202.2/2.html,转载请声明来源钻瓜专利网。