[发明专利]一种基于随机森林算法的智能音乐推送方法及存储介质有效
申请号: | 201910583330.0 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110442746B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 袁国文;张彩霞;陈锐;李纲 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06F18/2431;G06F16/68 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 528000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 算法 智能 音乐 推送 方法 存储 介质 | ||
1.一种基于随机森林算法的智能音乐推送方法,其特征在于,包括以下:
步骤1、获取用户的特征信息I,获取样本库歌曲的特征信息O,将特征信息I和O整合得到特征信息P;
步骤2、构件用于预测用户喜好的音乐的随机森林,并结合特征信息P进行训练得到用于预测用户喜好的音乐的随机森林模型;
步骤3、获取需要进行推送的歌曲以及需要推送的用户,将需要进行推送的歌曲以及需要推送的用户按照步骤1得到整合的特征信息,将整合的特征信息输入所述随机森林模型得到用户喜爱程度指数L,若L大于设定的阈值Q则将该歌曲推送给用户;
上述步骤1中用户的特征信息I包括用户所在的城市、用户的年龄、用户的性别以及用户的学历;获取所述特征信息I的方式为,设置一个用户注册登录的窗口,用户通过填写所述特征信息I完成注册;
上述步骤1中样本库歌曲的特征信息O包括歌曲的名称、歌曲演唱的歌手、歌曲的风格以及歌曲的时常;获取所述特征信息O的方式为,根据歌曲的信息在将歌曲选入样本库时自动获取;
上述步骤1中的特征信息P包括特征信息I、特征信息O、用户对样本库歌曲是否收藏的信息以及样本库歌曲在阈值时间内的播放热度信息;
上述步骤2中进行构建随机森林模型的方法包括以下:
步骤21、从样本库歌曲中,采用bootstrap方法有放回地随机抽取M个新的自助样本集,并根据所述自助样本集构建M棵分类回归树,每次未被抽到的样本组成M个袋外数据;
步骤22、将特征信息P的个数定义为n个,在每一棵树的每个节点处随机抽取m个特征,m≤n,通过计算信息增益的方式在m各特征中选择最具有分类能力的特征进行节点分裂;
步骤23、使每棵树最大限度地生长,不进行剪枝操作;
步骤24、将生成的K棵树组成随机森林,并生成随机森林模型,所述随机森林模型通过投票的方式对用户进行音乐推送,若投票为推送的树的数量占K的比例即用户喜爱程度指数L不低于阈值Q,则对该用户进行音乐推送;
上述步骤22中计算信息增益的方法为通过ID3算法进行计算,具体包括以下:
若特征信息P中的子特征p将样本库歌曲集T划分为T1、T2、…Tj共j个子集,则该子特征p的信息增益为
其中,M为歌曲集T的个数与步骤21中的M数值相同,|Te|为子集中属于Tj的样本个数,freq(Cf,T)为T的样本属于Cf类别的频率,s是T中样本的类别数量;
上述步骤24中的进行投票的方式为:
定义C为需要进行推送标签,则其中M为树的数量,I(*)为示性函数,c为单棵树hg对类C的分类结果,是树hg的叶子节点数,若C的权值大于阈值H,则代表单棵树hg赞成将该歌曲推送给用户。
2.一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1所述的基于随机森林算法的智能音乐推送方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910583330.0/1.html,转载请声明来源钻瓜专利网。