[发明专利]基于指挥调度系统的音频混音方法、装置及存储介质在审
申请号: | 202011472023.4 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112599150A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 葛建华;牛晓华;袁素华;刘岩;王莉;朱彤凯;张泽健;柯炎 | 申请(专利权)人: | 广州智讯通信系统有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/27;G10K15/08 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 曾令军 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 指挥 调度 系统 音频 方法 装置 存储 介质 | ||
1.基于指挥调度系统的音频混音方法,其特征在于,包括:
步骤S1:采集训练样本进行神经网络训练以构建神经网络模型;
步骤S2:获取至少两组调度话音的音频数据,使用各音频数据的声音位数表示其采样值,并对所有调取话音的音频数据的采样值进行归一化处理;
步骤S3:将归一化处理后的采样值输入至所述神经网络模型中以获得混音后的调度话音的音频数据。
2.根据权利要求1所述的基于指挥调度系统的音频混音方法,其特征在于,所述步骤S2中将各组调度话音的音频数据的采样值归一化至[-1,1]范围内。
3.根据权利要求1所述的基于指挥调度系统的音频混音方法,其特征在于,所述步骤S3中将音频数据的采样值输入所述神经网络模型之前,还包括对神经网络模型的混音参数和混音权重进行设置,使各组音频数据的混音权重之和为1。
4.根据权利要求1所述的基于指挥调度系统的音频混音方法,其特征在于,所述神经网络模型包含若干个神经元,其神经元个数与输入音轨数量相等。
5.根据权利要求1所述的基于指挥调度系统的音频混音方法,其特征在于,所述步骤S3中将归一化处理后的采样值输入所述神经网络模型后输出混音后的音频数据的采样值,若混音后的音频数据的采样值大于1时,将混音后的音频数据的采样值归为1;混音后的调度话音音频数据采样值小于-1时,将混音后的音频数据的采样值归为-1。
6.根据权利要求5所述的基于指挥调度系统的音频混音方法,其特征在于,所述步骤S3中混音后的音频数据的采样值等于所述神经网络模型输出的各组音频数据的采样值×各组音频数据的混音权重。
7.基于指挥调度系统的音频混音装置,其特征在于,包括:
神经网络训练模块,用于将训练样本的各组音频数据的采样值作为输入,将混音之后的音频数据的采样值作为输出,对网络进行训练以构建神经网络模型;
归一化处理模块,用于使用采集到的调度话音的音频数据的声音位数表示其采样值,对全部采集到的调度话音的音频数据的采样值进行数据归一化;
处理器模块,与所述归一化处理模块和神经网络训练模块相连,以将归一化处理后的音频数据的采样值输入至所述神经网络模型中以获得混音后的调度话音的音频数据。
8.根据权利要求7所述的基于指挥调度系统的音频混音装置,其特征在于,所述归一化处理模块将各组调度话音的音频数据的采样值归一化至[-1,1]范围内。
9.根据权利要求7所述的基于指挥调度系统的音频混音装置,其特征在于,还包括:
自定义设置模块,与神经网络训练模块相连,用于根据用户输入的自定义参数对神经网络模型的混音参数及混音权重进行自定义设置。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被执行时实现权利要求1~6任一所述的基于指挥调度系统的音频混音方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州智讯通信系统有限公司,未经广州智讯通信系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011472023.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种晶圆上镀银添加剂的制备方法
- 下一篇:灭火器自动化生产线