首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]语音信号自动增益控制方法在审

申请号：	201710181857.1	申请日：	2017-03-24
公开（公告）号：	CN106992003A	公开（公告）日：	2017-07-28
发明（设计）人：	李云飞	申请（专利权）人：	深圳北斗卫星信息科技有限公司
主分类号：	G10L15/20	分类号：	G10L15/20;G10L17/20
代理公司：	北京华仲龙腾专利代理事务所(普通合伙)11548	代理人：	李静
地址：	518000 广东省深圳市宝安区西乡***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音信号自动增益控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音信号自动增益控制方法，其特征在于，包括：

获得来自麦克风的语音信号；

将所述语音信号进行时域预处理，以得到第一信号；

将所述第一信号从时域向频域变换，以得到第二信号；

从所述第二信号中提取出描述人声特征的基音、共振峰频点；

将前256个所述频点划分为16个语音频段；

根据所述频点的有效性判断是语音帧还是静音帧，如果有效则认为当前是有人说话的语音帧，如果无效则视为无人说话的静音帧；

对于语音帧执行增益的自动调整算法，对于静音帧执行非人声噪声幅度计算算法，以得到第三信号；

将所述第三信号通过快速傅立叶逆变换转回时域以得到第四信号；

根据所述第四信号通过DAC电路输出语音。

2.根据权利要求1所述的语音信号自动增益控制方法，其特征在于，所述方法还包括：如果在当前语音帧中未找到人声特征信息，则当前语音帧被视为静音帧，此时对非人声噪声幅度进行估算，并依次计算16个语音频段的噪声幅度值并记录。

3.根据权利要求1和2所述的语音信号自动增益控制方法，其特征在于，对非人声噪声幅度进行估算，并依次计算16个语音频段的噪声幅度值并记录包括：

步骤1，采用下式计算每个语音段的噪声幅度：

其中，A_f为噪声幅度；

μ为前一语音帧所有频段噪声幅度值的均值；

σ为当前频段前一帧的、幅度值的、与μ的标准差；

A_测量为当前频段处的实测各频点噪声幅度的累加值；

A_估计为使用最小二乘算法、拟合当前语音频段噪声参数队列中前16个当前频段处的噪声幅度值，得到的一个当前频点最新噪声估计值；

步骤2，将步骤1计算出的当前语音频段的Af加入语音频段噪声参数队列末尾，队列采用先进先出模式，一直维持最新的16个计算值；

步骤3，当前静音帧所有语音频段的噪声幅度值均计算完后，计算μ、σ值，加入到语音频段噪声参数队列，这一队列中保存的数据将在下一个静音帧到来时运用到步骤1中的计算公式中。

4.根据权利要求1所述的语音信号自动增益控制方法，其特征在于，在语音帧中通过对256个语音频点逐点调整语音的频域幅度值，从而完成语音增益的自动调整。

5.根据权利要求3所述的语音信号自动增益控制方法，其特征在于，所述自动调整算法具体包括：

步骤a，设置语音帧噪声比例因子初始值Kn＝1；

步骤b，依次计算16个语音频段中各频点实测幅度的累加值，并除以该频段语音频段噪声参数队列中最后一个Af值，得到每个语音频段的噪声比例因子Knf；

步骤c，遍历16个语音频段的Knf，找出Knf<1.5的值中最大的一个，并将其赋值给Kn，如找不到符合条件的Knf，则保持Kn＝1不变；

步骤d，执行增益自动调整操作，使用下式逐频点计算调整后的幅度值：

Ag＝G(Ar-Kn*Af)

其中，G为增益比例调节因子，由用户通过旋钮进行调整；Ar为当前频点实测的幅度值。

6.根据权利要求5所述的语音信号自动增益控制方法，其特征在于，Af是出现语音帧前，最后一个静音帧的噪声幅度值，从语音频段噪声参数队列末尾取出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳北斗卫星信息科技有限公司，未经深圳北斗卫星信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710181857.1/1.html，转载请声明来源钻瓜专利网。

上一篇：用于改进含噪语音识别的动态声学模型切换
下一篇：一种调整视频的方法及终端

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top