[发明专利]基于语音处理的语音增强方法及相关设备有效
申请号: | 201910375361.7 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110223708B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 赵建平;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/27 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 居梦琪 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 处理 增强 方法 相关 设备 | ||
1.一种基于语音处理的语音增强方法,其特征在于,包括:
获取带有方向性噪音的原始语音信号,将所述原始语音信号依次输入滤波器和麦克风阵列,得到所述原始语音信号的固定波束麦克风阵列;
根据所述固定波束麦克风阵列,将所述原始语音信号分割成N个子空间语音信号;
从每一子空间语音信号中提取若干唤醒词,并对所述唤醒词分别进行分帧加窗处理;
根据每一子空间语音信号对应的分帧加窗处理后的所述唤醒词,计算对应子空间语音信号的置信度;
根据计算得到的每一子空间语音信号的置信度,选取所述置信度最高的所述子空间语音信号作为最终输出语音信号。
2.根据权利要求1所述的基于语音处理的语音增强方法,其特征在于,所述获取带有方向性噪音的原始语音信号,将所述原始语音信号依次输入滤波器和麦克风阵列,得到所述原始语音信号的固定波束麦克风阵列,包括:
获取带有方向性噪音的原始语音信号;
将所述原始语音信号输入所述滤波器,进行固定波束形成计算,所述固定波束形成计算公式如下:
其中,k为频点,c为原始语音信号的帧编号,Zc(k)为c的固定波速,为原始语音信号,为滤波器的系数,每帧的滤波器的系数为预设的不同常数,H为帧的数量;
将经过固定波速形成计算的所述原始语音信号输入所述麦克风阵列,得到所述原始语音信号的固定波束麦克风阵列。
3.根据权利要求1所述的基于语音处理的语音增强方法,其特征在于,所述根据所述固定波束麦克风阵列,将所述原始语音信号分割成N个子空间语音信号,包括:
将所述固定波束麦克风阵列划分为N个子阵列;
给所有子阵列中的每一向量赋予不同的权重,根据所述权重计算每一子阵列的方向性加权向量,每一所述方向性加权向量为对应子阵列的中心指向性向量;
以每一所述方向性加权向量的指向为分割依据,将所述原始语音信号分割成N个子空间语音信号。
4.根据权利要求1所述的基于语音处理的语音增强方法,其特征在于,所述从每一子空间语音信号中提取若干唤醒词,并对所述唤醒词分别进行分帧加窗处理,包括:
将所述子空间语音信号按照预设的语音分析时长分割成若干语音子片段,对每一语音子片段进行傅里叶变换,得到每一语音子片段的声音频谱,其中,傅里叶变换的公式为:
上式中,Y(n)表示经过傅里叶变换后的声音频谱,y(n)表示原声音频谱,f表示频率分辨率,n表示声波波长,N表示汉宁窗长度;
将每一语音子片段的声音频谱放在同一个坐标系下,所述坐标系以频率为横坐标,以振幅为纵坐标;
提取纵坐标大于预设阈值的所述声音频谱对应的语音子片段作为所述唤醒词,并对所述唤醒词分别进行分帧加窗处理。
5.根据权利要求1所述的基于语音处理的语音增强方法,其特征在于,所述根据每一子空间语音信号对应的分帧加窗处理后的所述唤醒词,计算对应子空间语音信号的置信度,包括:
分别将每一子空间语音信号中的所述唤醒词输入到训练好的神经网络模型中,计算每一子空间语音信号的后验概率,计算公式为:
hsmooth=max{1,j-wsmooth+1}
上式中,P为唤醒词的后验概率,j为唤醒词的帧,k为隐藏层,i为唤醒词,wsmooth为滑动窗口,hsmooth为滑动窗口内帧的索引;
根据每一子空间语音信号的后验概率,计算对应子空间语音信号的置信度,计算公式为:
hmax=max{1,j-wmax+1}
上式中,S为置信度,i为唤醒词,j为唤醒词的帧,P为唤醒词的后验概率,wmax为滑动窗口,hsmooth为滑动窗口内帧的索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910375361.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:一种录音频谱显示方法及终端设备