[发明专利]语音增强方法、装置、设备及存储介质有效
申请号: | 201810967670.9 | 申请日: | 2018-08-23 |
公开(公告)号: | CN110858485B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 刘章;余涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 设备 存储 介质 | ||
1.一种语音增强方法,包括:
将麦克风阵列中两个麦克风的输出相减,以得到一阶差分输出;
将所述一阶差分输出与预定阈值进行比较;
基于比较结果,确定各个频点的隐蔽值,其中,所述隐蔽值用于表征带噪语音中噪声对语音的遮蔽情况,当所述一阶差分输出小于所述预定阈值时,由所述两个麦克风组成的一阶差分麦克风的零陷对准指定方向,所述指定方向为所述两个麦克风相对于说话人的方向;以及
基于所述隐蔽值进行语音增强。
2.根据权利要求1所述的语音增强方法,其中,所述确定各个频点的隐蔽值的步骤包括:
将所述一阶差分输出小于所述预定阈值时的频点的隐蔽值确定为1,并且将所述一阶差分输出大于或等于所述预定阈值时的频点的隐蔽值确定为0。
3.根据权利要求1所述的语音增强方法,其中,所述确定各个频点的隐蔽值的步骤包括:
基于多个所述一阶差分输出分别与所述预定阈值进行比较的结果,确定每个所述一阶差分输出的隐蔽值估计结果;以及
基于多个所述隐蔽值估计结果中对应同一频点的隐蔽值,确定该频点最终的隐蔽值。
4.根据权利要求3所述的语音增强方法,其中,所述确定该频点最终的隐蔽值的步骤包括:
将所述多个所述隐蔽值估计结果中对应同一频点的隐蔽值的乘积,作为该频点最终的隐蔽值。
5.根据权利要求1所述的语音增强方法,其中,
所述一阶差分输出等于滤波器系数与所述两个麦克风的时频域数据构成的矩阵的乘积。
6.根据权利要求5所述的语音增强方法,其中,所述滤波器系数为
其中,h(ω)为滤波器系数,τ0是两个麦克风的距离除以声速,ω是角频率,α是用来调节差分零陷的方向的参数。
7.根据权利要求6所述的语音增强方法,还包括:
基于说话人的声源位置信息,计算所述两个麦克风与所述说话人的相对角度;以及
基于所述相对角度确定所述滤波器系数中的α。
8.根据权利要求7所述的语音增强方法,其中,所述计算所述两个麦克风与所述说话人的相对角度的步骤包括:
确定所述两个麦克风的中心到所述说话人的第一方向向量;
确定所述两个麦克风中一个麦克风到另一个麦克风的第二方向向量;
基于所述第一方向向量和所述第二方向向量,计算所述相对角度。
9.根据权利要求1所述的种语音增强方法,其中,所述基于所述隐蔽值进行语音增强的步骤包括:
基于所述隐蔽值,计算对应语音的第一相关矩阵和对应噪音的第二相关矩阵;以及
基于所述第一相关矩阵和所述第二相关矩阵,利用波束形成算法进行语音增强。
10.根据权利要求9所述的语音增强方法,其中,
所述第一相关矩阵为基于所述隐蔽值从所述麦克风阵列输出的时频域数据中提取出的对应语音部分的协方差矩阵,
所述第二相关矩阵为基于所述隐蔽值从所述麦克风阵列输出的时频域数据中提取出的对应噪声部分的协方差矩阵。
11.一种语音增强装置,包括:
差分模块,用于将麦克风阵列中两个麦克风的输出相减,以得到一阶差分输出;
比较模块,用于将所述一阶差分输出与预定阈值进行比较;
确定模块,用于基于比较结果,确定各个频点的隐蔽值,其中,所述隐蔽值用于表征带噪语音中噪声对语音的遮蔽情况,当所述一阶差分输出小于所述预定阈值时,由所述两个麦克风组成的一阶差分麦克风的零陷对准指定方向,所述指定方向为所述两个麦克风相对于说话人的方向;以及
语音增强模块,用于基于所述隐蔽值进行语音增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810967670.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种洗涤剂
- 下一篇:一种云分发网络调度系统及方法