[发明专利]音量控制方法、装置及存储介质有效
申请号: | 201811506570.2 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109587603B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 张晨 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | H04R3/12 | 分类号: | H04R3/12 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 唐述灿 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音量 控制 方法 装置 存储 介质 | ||
1.一种音量控制方法,其特征在于,包括:
获取声音信号;
获取所述声音信号的能量矩阵;
基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度,所述活动度反映所述声音信号中的目标声音的活动程度;
基于所述目标声音的活动度确定所述声音信号的实际增益;
根据所述实际增益调节所述声音信号,以控制所述声音信号的音量。
2.根据权利要求1所述的音量控制方法,其特征在于,所述获取所述声音信号的能量矩阵,包括:
通过傅里叶变换FFT将所述声音信号转换成频域信号;
获取所述频域信号的频域能量信号;
将所述频域能量信号与之前参考数量的频域能量信号组合,得到所述声音信号的能量矩阵。
3.根据权利要求1所述的音量控制方法,其特征在于,所述基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度,包括:
基于所述声音信号的能量矩阵获取所述能量矩阵的等效图的特征,所述能量矩阵的等效图的特征包括灰度丰富度和纹理复杂度中的至少一种;
基于所述能量矩阵的等效图的特征确定所述声音信号中的目标声音的活动度。
4.根据权利要求3所述的音量控制方法,其特征在于,所述基于所述声音信号的能量矩阵获取所述能量矩阵的等效图的特征,包括:
获取所述能量矩阵的方差,并获取所述能量矩阵的均值;
根据所述能量矩阵的方差及均值获取所述能量矩阵的等效图的灰度丰富度。
5.根据权利要求3所述的音量控制方法,其特征在于,所述基于所述声音信号的能量矩阵获取所述能量矩阵的等效图的特征,包括:
将所述能量矩阵的等效图划分为多个子块,对各个子块做不同方向的帧内预测;
获取任一子块在任一方向的预测值与所述任一子块的各行实际像素值之间的绝对值误差,并对所述任一子块在所述任一方向的绝对值误差求平均,将得到的平均绝对值误差作为所述任一子块在所述任一方向的块误差;
对所述任一子块在各方向的块误差求平均,将得到的平均块误差作为所述任一子块的失真值;
对所有子块的失真值求平均,将得到的平均失真值作为所述能量矩阵的等效图的纹理复杂度。
6.根据权利要求3所述的音量控制方法,其特征在于,所述基于所述能量矩阵的等效图的特征确定所述声音信号中的目标声音的活动度,包括:
基于所述能量矩阵的等效图的特征确定所述声音信号中的目标声音的初始活动度;
根据所述初始活动度和活动度阈值的关系,确定所述声音信号中的目标声音的活动度。
7.根据权利要求6所述的音量控制方法,其特征在于,所述基于所述能量矩阵的等效图的特征确定所述声音信号中的目标声音的初始活动度,包括:
对所述能量矩阵的等效图的灰度丰富度和纹理复杂度进行加权求和,得到的加权求和结果作为所述声音信号中的目标声音的初始活动度。
8.根据权利要求6所述的音量控制方法,其特征在于,所述根据所述初始活动度和活动度阈值的关系,确定所述声音信号中的目标声音的活动度,包括:
若所述初始活动度大于第一活动度阈值,则所述目标声音的活动度为第一参考值;
若所述初始活动度小于第二活动度阈值,则所述目标声音的活动度为第二参考值;
若所述初始活动度大于所述第二活动度阈值,且小于所述第一活动度阈值,则获取所述初始活动度与所述第二活动度阈值之间的第一差值,并获取所述第一活动度阈值与所述第二活动度阈值之间的第二差值,将所述第一差值与所述第二差值的商作为所述目标声音的活动度;其中,所述第一活动度阈值大于所述第二活动度阈值,所述第一参考值大于所述第二参考值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811506570.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频信号升压控制电路
- 下一篇:一种发声装置以及电子设备