[发明专利]一种潜力爆款歌曲挖掘方法、装置、设备及介质在审
申请号: | 202110956304.5 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113627559A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 吴跃 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16;G06F16/215;G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 陈彦如 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 潜力 歌曲 挖掘 方法 装置 设备 介质 | ||
本申请公开了一种潜力爆款歌曲挖掘方法、装置、设备、介质,该方法包括:获取候选歌曲的第一评论数据及参考爆款歌曲的第二评论数据;分别对第一评论数据和第二评论数据进行处理,筛选出第一优良评论数据和第二优良评论数据;分别对第一优良评论数据对应的第一向量和第二优良评论数据对应的第二向量进行全样本空间上的各向同性变换,得到第一处理后向量和第二处理后向量;分别利用第一处理后向量和第二处理后向量确定候选歌曲的候选歌曲向量和参考爆款歌曲的参考向量;确定候选歌曲向量与参考向量之间的相似度,并根据相似度确定候选歌曲是否为潜力爆款歌曲。这样能够提高对潜力爆款歌曲的召回率。
技术领域
本申请涉及音乐处理技术领域,特别涉及一种潜力爆款歌曲挖掘方法、装置、设备、介质。
背景技术
在音乐应用中,通常会进行潜力爆款歌曲挖掘,以便吸引更多的用户以及提高用户粘性等。目前的潜力爆款歌曲挖掘方法主要是,利用歌曲音频信息等进行挖掘潜力爆款歌曲,以及应用黑马用户进行挖掘的黑马算法。但是上述两种方法都存在较多相关的潜力爆款歌曲不能被检出的问题,也即,对潜力爆款歌曲的召回率较低。
发明内容
有鉴于此,本申请的目的在于提供一种潜力爆款歌曲挖掘方法、装置、设备、介质,能够提高对潜力爆款歌曲的召回率。其具体方案如下:
第一方面,本申请公开了一种潜力爆款歌曲挖掘方法,包括:
获取候选歌曲的第一评论数据及参考爆款歌曲的第二评论数据;
分别对所述第一评论数据和所述第二评论数据进行处理,筛选出第一优良评论数据和第二优良评论数据;
分别对所述第一优良评论数据对应的第一向量和所述第二优良评论数据对应的第二向量进行全样本空间上的各向同性变换,得到第一处理后向量和第二处理后向量;
分别利用所述第一处理后向量和所述第二处理后向量确定所述候选歌曲的候选歌曲向量和所述参考爆款歌曲的参考向量;
确定所述候选歌曲向量与所述参考向量之间的相似度,并根据所述相似度确定所述候选歌曲是否为潜力爆款歌曲。
可选地,所述分别对所述第一评论数据和所述第二评论数据进行处理,筛选出第一优良评论数据和第二优良评论数据,包括:
将所述第一评论数据输入到预先训练完成的BERT模型中,得到所述BERT模型输出的第一分类结果,并将所述第一分类结果中的优质评论数据和良好评论数据作为所述第一优良评论数据;
将所述第二评论数据输入到所述BERT模型中,得到所述BERT模型输出的第二分类结果,并将所述第二分类结果中的优质评论数据和良好评论数据作为所述第二优良评论数据。
可选地,对所述第一优良评论数据对应的第一向量进行全样本空间上的各向同性变换,得到第一处理后向量,包括:
将所述第一优良评论数据经过所述BERT模型的最后一层时的CLS向量作为所述第一向量,其中,所述第一向量中包括不同评论对应的向量;
确定所述第一向量中各条评论对应的向量的平均向量;
利用所述平均向量和第一运算公式确定协方差矩阵,其中,所述第一运算公式为:
V表示所述协方差矩阵,N表示所述第一向量对应的评论的总条数,xi表示所述第一向量中第i条评论对应的向量,xi为1×m维的向量,(·)T表示矩阵的转置运算,u表示所述平均向量;
根据第二运算公式对所述协方差矩阵做奇异值分解,确定出第一矩阵和第二矩阵,其中,所述第二运算公式为:V=UQUT,U表示第一矩阵,Q表示第二矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110956304.5/2.html,转载请声明来源钻瓜专利网。