[发明专利]音频推荐的方法、装置、计算机设备和存储介质在审
申请号: | 202110298543.6 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113032616A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 梁贝茨;陈全;蔡宗颔 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06F16/683;G06F16/68;G06F16/9535 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 推荐 方法 装置 计算机 设备 存储 介质 | ||
本公开提供了一种音频推荐的方法、装置、计算机设备和存储介质,属于音视频技术领域。该方法包括:在进行音频推荐时,获取目标账户的历史信息中提取的历史音频,并且获取多个候选音频,其中,多个候选音频包括上线时长低于第一时长的音频和/或上线时长超过第一时长且播放量低于第一阈值的音频。然后提取获取的每个音频的第一特征和第二特征;对于获取的每个音频,使用音频的第一特征的统计值和第二特征的统计值进行封装,获得音频的音频表征。在多个候选音频中,选择音频表征与历史音频中任一音频的音频表征的相似度高于第二阈值的音频,推荐至目标账户。采用本公开,可以提升音频推荐的准确率。
技术领域
本公开涉及音视频技术领域,特别涉及一种音频推荐的方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术和网络技术的发展,越来越多的音乐应用程序都进行个性化音乐推荐。音乐应用程序一般是基于音频的描述信息,如音频的语种、版本等,筛选出与用户匹配的音频,推荐给用户。
然而新上线的音频或者曲库中的冷门音频,其音频的描述信息并不完备或者存在标签不准确的问题,并不能基于音频的描述信息,为用户进行推荐这些音频,所以会导致推荐准确率比较低。
发明内容
本公开实施例提供了一种音频推荐的方法、装置、计算机设备和存储介质,能够解决推荐准确率比较低的问题。所述技术方案如下:
一方面,本公开提供了一种音频推荐的方法,所述方法包括:
获取目标账户的历史信息中提取的历史音频;
获取多个候选音频,其中,所述多个候选音频包括上线时长低于第一时长的音频和/或上线时长超过所述第一时长且播放量低于第一阈值的音频;
提取获取的每个音频的第一特征和第二特征;
对于获取的每个音频,使用所述音频的第一特征的统计值和第二特征的统计值进行封装,获得所述音频的音频表征;
在所述多个候选音频中,选择音频表征与所述历史音频中任一音频的音频表征的相似度高于第二阈值的音频,推荐至所述目标账户。
在一种可能的实现方式中,所述第一特征为属性特征,所述第二特征为流派特征;
所述提取获取的每个音频的第一特征和第二特征,包括:
将获取的每个音频按照时间顺序分割为等间隔的音频段;
确定每个音频的各音频段属于每个属性的置信度,获得每个音频的属性特征;其中,所述属性包括纯人声、纯音乐、伴奏音源或者目标属性中的一种或多种;
确定每个音频的各音频段属于每个流派的置信度,获得每个音频的流派特征。
在一种可能的实现方式中,所述对于获取的每个音频,使用所述音频的第一特征的统计值和第二特征的统计值进行封装,获得所述音频的音频表征,包括:
对于获取的每个音频,将所述音频的M*T维属性特征和所述音频的N*T维流派特征合并为(M+N)*T维特征,其中,M为属性的数目,N为流派的数目,T为所述音频包括的音频段的数目;
在所述音频的(M+N)*T维特征中,分别确定M个属性中各属性按照时间顺序排列的T个置信度的P个统计值、N个流派中各流派按照时间顺序排列的T个置信度的P个统计值,获得所述音频的(M+N)*P维音频表征,其中,所述统计值包括最小值、最大值、均值、方差、峰值或偏度中的一种或多种。
这样,可以使得每个音频的音频表征的维度相同。
在一种可能的实现方式中,所述对于获取的每个音频,使用所述音频的第一特征的统计值和第二特征的统计值进行封装,获得所述音频的音频表征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110298543.6/2.html,转载请声明来源钻瓜专利网。