[发明专利]游戏音乐风格分类方法、装置、可读介质及电子设备在审
申请号: | 202110615605.1 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113813609A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 彭博 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | A63F13/54 | 分类号: | A63F13/54;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 王鹏健 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 游戏 音乐风格 分类 方法 装置 可读 介质 电子设备 | ||
1.一种游戏音乐风格分类方法,其特征在于,包括:
获取游戏音乐数据集,所述游戏音乐数据集包括游戏音频;
将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,所述游戏音频聚类集包括经过无监督聚类后聚集在一个集合中的游戏音频;
从所述游戏音频聚类集中选取多个游戏音频样本,并根据所述多个游戏音频样本的内容相关性确定所述游戏音频聚类集的音乐风格标签;
对所述游戏音乐数据集中的游戏音频添加音乐风格标签,得到音频标签数据集。
2.根据权利要求1所述的游戏音乐风格分类方法,其特征在于,还包括:
获取音频标签数据集和待分类游戏音频;
将所述音频标签数据集中带有音乐风格标签的游戏音频通过短时傅里叶变换得到梅尔频谱图;
将所述梅尔频谱图输入预设的深度卷积神经网络进行训练,得到用于音乐风格标签预测的网络模型;
将待分类游戏音频通过短时傅里叶变换得到梅尔频谱图,并输入所述用于音乐风格标签预测的网络模型得到待分类游戏音频的音乐风格标签。
3.根据权利要求2所述的游戏音乐风格分类方法,其特征在于,将所述梅尔频谱图输入预设的深度卷积神经网络进行训练,得到用于音乐风格标签预测的网络模型,包括:
利用所述音频标签数据集中带有音乐风格标签的游戏音频通过短时傅里叶变换得到的频谱图集对深度卷积神经网络进行有监督的学习,得到合适的权重参数矩阵和偏移量;
将权重参数矩阵和偏移量对应地赋值给所述深度卷积神经网络的各个层。
4.根据权利要求1所述的游戏音乐风格分类方法,其特征在于,将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,包括:
随机裁剪游戏音乐数据集中每一个游戏音频的任意两个片段,将所述每一个游戏音频的任意两个片段转换成音频特征向量后组成音频切片对;
将所述音频切片对输入到多类交叉熵对比损失函数中进行无监督训练,得到无监督训练的游戏音乐数据集,所述多类交叉熵对比损失函数用于减小音频切片对的对内特征距离并增大音频切片对的对间特征距离。
5.根据权利要求4所述的游戏音乐风格分类方法,其特征在于,将所述游戏音乐数据集中的游戏音频进行无监督聚类,得到游戏音频聚类集,还包括:
将所述无监督训练的游戏音乐数据集中每一个音频对应的音频特征向量输入到贪心算法中进行无监督聚类,得到游戏音频聚类集。
6.根据权利要求5所述的游戏音乐风格分类方法,其特征在于,将所述无监督训练的游戏音乐数据集中每一个音频对应的音频特征向量输入到贪心算法中进行无监督聚类,包括:
选取所述无监督训练的游戏音乐数据集中距离最小的一对音频特征向量;
若所述距离最小的一对音频特征向量的距离小于指定阈值,则将距离最小的一对音频特征向量聚为一类,组成一个游戏音频聚类集。
7.根据权利要求1所述的游戏音乐风格分类方法,其特征在于,根据所述多个游戏音频样本的内容相关性确定所述游戏音频聚类集的音乐风格标签,包括:
提取游戏音乐数据集中游戏音频的游戏音乐特征;
将所述游戏音乐特征与游戏音乐特征对应的音乐风格标签输入到机器学习模型中进行训练,得到基于游戏音乐特征进行音乐风格标签预测的标签标定模型;
提取所述游戏音频聚类集中多个游戏音频样本的游戏音乐特征,将所述游戏音频聚类集中多个游戏音频样本的游戏音乐特征输入到所述标签标定模型中,得到所述游戏音频聚类集音乐风格标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110615605.1/1.html,转载请声明来源钻瓜专利网。