[发明专利]音量控制方法、装置及存储介质有效

申请号：	201811506570.2	申请日：	2018-12-10
公开（公告）号：	CN109587603B	公开（公告）日：	2020-11-10
发明（设计）人：	张晨	申请（专利权）人：	北京达佳互联信息技术有限公司
主分类号：	H04R3/12	分类号：	H04R3/12
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	唐述灿
地址：	100084 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音量控制方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种音量控制方法、装置及存储介质，属于信号处理技术领域。方法包括：获取声音信号；获取所述声音信号的能量矩阵；基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度；基于所述目标声音的活动度确定所述声音信号的实际增益；根据所述实际增益调节所述声音信号，以控制所述声音信号的音量。通过声音信号的能量矩阵确定声音信号中的目标声音的活动度，并通过目标声音的活动度来确定声音信号的实际增益，从而能够避免环境中的底噪被放大，使得音量的控制更加匹配听觉特性，进而可以提升音量控制效果。

技术领域

本公开涉及信号处理技术领域，尤其涉及一种音量控制方法、装置及存储介质。

背景技术

随着互联网的兴起，依托于互联网的社交媒体越来越多，网络直播便是其中的一种。网络直播吸取和延续了互联网的优势，利用视讯方式进行网上现场直播，因为直播是实时的，而直播环境千差万别，主播自身的声音大小不同，距离麦克风的距离也不同，因此直播声音响度差别很大。为了直播的声音响度体验更加一致，避免声音响度忽大忽小，需要有自动控制音量响度的处理。

相关技术中，根据输入信号的幅度和目标幅度自动调节增益值，使得输出信号的幅度接近目标幅度。

然而，该种方式主要基于信号幅度，有可能将环境中的底噪放大，导致控制效果不佳。

发明内容

本公开提供一种音量控制方法、装置及存储介质，能够克服相关技术中的问题。

根据本公开实施例的第一方面，提供一种音量控制方法，包括：

获取声音信号；

获取所述声音信号的能量矩阵；

基于所述声音信号的能量矩阵确定所述声音信号中的目标声音的活动度；

基于所述目标声音的活动度确定所述声音信号的实际增益；

根据所述实际增益调节所述声音信号，以控制所述声音信号的音量。

在一种可能的实施方式中，所述获取所述声音信号的能量矩阵，包括：

通过FFT(Fast Fourier Transformation，傅里叶变换)将所述声音信号转换成频域信号；