[发明专利]音量控制方法、装置及存储介质有效
申请号: | 201811506570.2 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109587603B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 张晨 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | H04R3/12 | 分类号: | H04R3/12 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 唐述灿 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音量 控制 方法 装置 存储 介质 | ||
本公开是关于一种音量控制方法、装置及存储介质,属于信号处理技术领域。方法包括:获取声音信号;获取所述声音信号的能量矩阵;基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度;基于所述目标声音的活动度确定所述声音信号的实际增益;根据所述实际增益调节所述声音信号,以控制所述声音信号的音量。通过声音信号的能量矩阵确定声音信号中的目标声音的活动度,并通过目标声音的活动度来确定声音信号的实际增益,从而能够避免环境中的底噪被放大,使得音量的控制更加匹配听觉特性,进而可以提升音量控制效果。
技术领域
本公开涉及信号处理技术领域,尤其涉及一种音量控制方法、装置及存储介质。
背景技术
随着互联网的兴起,依托于互联网的社交媒体越来越多,网络直播便是其中的一种。网络直播吸取和延续了互联网的优势,利用视讯方式进行网上现场直播,因为直播是实时的,而直播环境千差万别,主播自身的声音大小不同,距离麦克风的距离也不同,因此直播声音响度差别很大。为了直播的声音响度体验更加一致,避免声音响度忽大忽小,需要有自动控制音量响度的处理。
相关技术中,根据输入信号的幅度和目标幅度自动调节增益值,使得输出信号的幅度接近目标幅度。
然而,该种方式主要基于信号幅度,有可能将环境中的底噪放大,导致控制效果不佳。
发明内容
本公开提供一种音量控制方法、装置及存储介质,能够克服相关技术中的问题。
根据本公开实施例的第一方面,提供一种音量控制方法,包括:
获取声音信号;
获取所述声音信号的能量矩阵;
基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度;
基于所述目标声音的活动度确定所述声音信号的实际增益;
根据所述实际增益调节所述声音信号,以控制所述声音信号的音量。
在一种可能的实施方式中,所述获取所述声音信号的能量矩阵,包括:
通过FFT(Fast Fourier Transformation,傅里叶变换)将所述声音信号转换成频域信号;
获取所述频域信号的频域能量信号;
将所述频域能量信号与之前参考数量的频域能量信号组合,得到所述声音信号的能量矩阵。
在一种可能的实施方式中,所述基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度,包括:
基于所述声音信号的能量矩阵获取所述能量矩阵的等效图的特征,所述能量矩阵的等效图的特征包括灰度丰富度和纹理复杂度中的至少一种;
基于所述能量矩阵的等效图的特征确定所述声音信号中的目标声音的活动度。
在一种可能的实施方式中,所述基于所述声音信号的能量矩阵获取所述能量矩阵的等效图的特征,包括:
获取所述能量矩阵的方差,并获取所述能量矩阵的均值;
根据所述能量矩阵的方差及均值获取所述能量矩阵的等效图的灰度丰富度。
在一种可能的实施方式中,所述基于所述声音信号的能量矩阵获取所述能量矩阵的等效图的特征,包括:
将所述能量矩阵的等效图划分为多个子块,对各个子块做不同方向的帧内预测;
获取任一子块在任一方向的预测值与所述任一子块的各行实际像素值之间的绝对值误差,并对所述任一子块在所述任一方向的绝对值误差求平均,将得到的平均绝对值误差作为所述任一子块在所述任一方向的块误差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811506570.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频信号升压控制电路
- 下一篇:一种发声装置以及电子设备