[发明专利]一种融合超声波信号特征的语音增强方法及系统在审
申请号: | 202111316293.0 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114067824A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 丁菡;王一展;李昊;赵衰;王鸽;惠维;赵鲲;赵季中;王鹏;董博 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0264;G10L21/0216;G10L25/30;H04L25/02 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 超声波 信号 特征 语音 增强 方法 系统 | ||
1.一种融合超声波信号特征的语音增强方法,其特征在于,包括以下步骤:
S1、移动设备同时发射并接收预定义的超声信号,在发射超声信号的同时,发送用户语音;移动设备接收到描绘发声动作的超声波信号和用户语音;超声波信号用于信道估计以提取信道冲击响应矩阵,将信道冲击响应矩阵沿时间轴逐位求一阶差分得到一阶差分信道冲击响应,对用户语音进行降采样,再经短时傅里叶变换得到语音信号的时频谱图;
S2、将步骤S1得到的一阶差分信道冲击响应和语音信号的时频谱图分别输入深度复数神经网络,深度复数神经网络预测复值比率掩码,将语音信号的时频谱图与预测的复值比率掩码逐位相乘得到增强语音的时频谱图,然后通过逆短时傅里叶变换得到增强后的时序语音信号,实现语音增强。
2.根据权利要求1所述的融合超声波信号特征的语音增强方法,其特征在于,步骤S1具体为:
S101、发射端的超声信号选择GSM序列作为基础序列,当超声波的采样率为48KHz时,以100Hz的频率计算信道冲击响应,将GSM训练序列进行12倍上采样,然后在结尾添加168位的零值作为保护位形成一段训练序列,最后将发射信号乘以变频到超声频带,同时进行带通滤波使超声信号保持在18~22KHz,根据GSM序列进行采样及补零插值后生成的训练序列帧的数据得到循环训练序列矩阵M;
S102、在接收端,通过滤波器将接收到的超声信号划分成两部分:通过截止频率为8KHz的低通滤波器得到带噪的用户语音,对用户语音部分从48KHz降采样到16KHz,然后以20毫秒的汉明窗和10毫秒的跳跃长度进行短时傅里叶变换得到语音信号的时频谱图,作为神经网络语音分支的输入;
S103、将信道冲击响应矩阵沿时间轴逐位求一阶差分得到一阶差分信道冲击响应,然后将一阶差分信道冲击响应作为神经网络超声分支的输入。
3.根据权利要求2所述的融合超声波信号特征的语音增强方法,其特征在于,步骤S101中,循环训练序列矩阵M由训练序列的数据部分D={m1,m2,…,mP},循环训练序列矩阵M为:
其中,P是训练序列中数据部分的长度。
4.根据权利要求2所述的融合超声波信号特征的语音增强方法,其特征在于,步骤S102中,接收信号通过截止频率为18KHz的高通滤波器得到信号的超声部分,首先进行帧检测使发射信号和接收信号对齐,然后将高通滤波后得到的超声部分接收信号分别乘以和作为接收基带信号r(t)的实部和虚部,然后通过截止频率为2KHz的低通滤波器消除带外噪声。
5.根据权利要求4所述的融合超声波信号特征的语音增强方法,其特征在于,通过最小二乘信道估计算法计算信号冲击响应得到一个70×100的复数CIR矩阵h如下:
h=argmin||R-Mh||2
其中,R为接收信号,h为信号冲击响应。
6.根据权利要求1所述的融合超声波信号特征的语音增强方法,其特征在于,步骤S2中,增强语音的时频谱图具体为:
其中,N为带噪语音时频谱图,预测复值比率掩码MCRM为:
其中,Nr,Ns是带噪语音时频谱图的实部和虚部;Sr,Si是纯净语音的实部和虚部,为CRM的实部,j为虚数单位,为CRM的虚部,r为复数的实部,i为复数的虚部。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111316293.0/1.html,转载请声明来源钻瓜专利网。