[发明专利]语音增强的方法与装置有效
申请号: | 201810395019.9 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108447500B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 安黄彬 | 申请(专利权)人: | 深圳市沃特沃德股份有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0216;G10L21/0208;G10L25/18;G10L25/21;H04M1/19 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市南山区蛇口*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 | ||
1.一种语音增强的方法,其特征在于,通过双麦克语音通道采集语音信号,且各语音通道分别进行语音增强处理,包括:
获取当前语音信号的频域信号;
按照预设规则将所述频域信号划分为多个依次排布的子频带;
根据最小方差无失真响应算法分别计算各所述子频带的第一波束输出;
通过对各所述第一波束输出进行平均值计算,获取所述频域信号的第二波束输出;
所述根据最小方差无失真响应算法分别计算各所述子频带的第一波束输出的步骤,包括:
在各所述子频带内分别通过语音激活检测,获取相邻的两个非语音段的功率比;
根据所述功率比获取相应的去除所述非语音段的平滑因子;
根据所述平滑因子得到各所述子频带内的频带特征的协方差矩阵;
根据所述协方差矩阵进行特征分解,得到各所述子频带的输出权向量。
2.根据权利要求1所述的语音增强的方法,其特征在于,所述按照预设规则将所述频域信号划分为多个依次排布的子频带的步骤,包括:
区分所述频域信号中的敏感频段,其中,所述敏感频段为第一频段,所述频域信号中除所述敏感频段之外的频段为第二频段;
将所述第一频段均匀划分为多个第一子频带,将所述第二频段均匀划分为多个第二子频带,其中,所述第二子频带的带宽大于所述第一子频带的带宽。
3.根据权利要求1所述的语音增强的方法,其特征在于,所述获取当前语音信号的频域信号的步骤,包括:
获取所述双麦克语音通道分别采集的当前语音信号的第一时域信号;
将所述第一时域信号分别输入到所述双麦克语音通道分别对应的带通滤波器,分别得到指定频率范围的优选时域信号;
将所述优选时域信号分别通过与所述双麦克语音通道分别关联的傅氏变换,分别转换为当前语音信号的所述指定频率范围的频域信号。
4.根据权利要求3所述的语音增强的方法,其特征在于,所述通过对各所述第一波束输出进行平均值计算,获取所述频域信号的第二波束输出的步骤之后,包括:
通过将所述频域信号的第二波束输出分别输入到与所述双麦克语音通道分别关联的反傅氏变换器中,将所述频域信号转换为输出时域信号;
通过所述双麦克语音通道分别输出对应的所述输出时域信号。
5.一种语音增强的装置,其特征在于,通过双麦克语音通道采集语音信号,且各语音通道分别进行语音增强处理,包括:
第一获取模块,用于获取当前语音信号的频域信号;
划分模块,用于按照预设规则将所述频域信号划分为多个依次排布的子频带;
计算模块,用于根据最小方差无失真响应算法分别计算各所述子频带的第一波束输出;
第二获取模块,用于通过对各所述第一波束输出进行平均值计算,获取所述频域信号的第二波束输出;
所述计算模块包括:
第一获取子模块,用于在各所述子频带内分别通过语音激活检测,获取相邻的两个非语音段的功率比;
第二获取子模块,用于根据所述功率比获取相应的去除所述非语音段的平滑因子;
第一得到子模块,用于根据所述平滑因子得到各所述子频带内的频带特征的协方差矩阵;
第二得到子模块,用于根据所述协方差矩阵进行特征分解,得到各所述子频带的输出权向量。
6.根据权利要求5所述的语音增强的装置,其特征在于,所述划分模块包括:
区分子模块,用于区分所述频域信号中的敏感频段,其中,所述敏感频段为第一频段,所述频域信号中除所述敏感频段之外的频段为第二频段;
划分子模块,用于将所述第一频段均匀划分为多个第一子频带,将所述第二频段均匀划分为多个第二子频带,其中,所述第二子频带的带宽大于所述第一子频带的带宽。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市沃特沃德股份有限公司,未经深圳市沃特沃德股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810395019.9/1.html,转载请声明来源钻瓜专利网。