[发明专利]基于深度学习注意力机制的频带扩展方法及装置在审
申请号: | 202010933415.X | 申请日: | 2020-09-08 |
公开(公告)号: | CN112233685A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 方泽煌;康元勋 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
主分类号: | G10L19/022 | 分类号: | G10L19/022;G10L19/26;G10L25/18;G10L25/27;G10L25/45 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;麦小婵 |
地址: | 361009 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 注意力 机制 频带 扩展 方法 装置 | ||
1.一种基于深度学习注意力机制的频带扩展方法,其特征在于,包括:
基于窄带语音信号生成伪高频信号;
计算所述伪高频信号的功率谱能量;
通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;
将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;
对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。
2.根据权利要求1所述的基于深度学习注意力机制的频带扩展方法,其特征在于,所述逆滤波参数估计模型包括输入层、第一Dense层、第一GRU层、第二GRU层、Attention层、第二Dense层以及输出层;其中,所述第一Dense层接收所述输入层输出的数据,所述第一GRU层接收所述第一Dense层输出的数据,所述第二GRU层接收所述第一GRU层输出的数据,所述Attention层接收所述第一GRU层输出的数据和所述第二GRU层输出的数据,所述第二Dense层接收所述Attention层输出的数据和所述第一GRU层输出的数据。
3.根据权利要求1所述的基于深度学习注意力机制的频带扩展方法,其特征在于,所述逆滤波参数估计模型通过采用Adam训练策略和改进的loss函数训练得到,所述改进的loss函数为:
其中,x为期望的逆滤波参数,n为输入训练的总帧数,u为放缩因子,t表示期望的逆滤波参数对应的功率谱频率索引,h表示2kHz对应的频率索引,表示1~2kHz的能量总和。
4.根据权利要求2所述的基于深度学习注意力机制的频带扩展方法,其特征在于,所述Attention层的计算公式为:
score(hk,hq)=hkTWhq
其中,hk为所述第一GRU层的输出、hq为所述第二GRU层的输出,score(.)表示相关性得分,W为hk和hq的权重。
5.根据权利要求1所述的基于深度学习注意力机制的频带扩展方法,其特征在于,所述基于窄带语音信号生成伪高频信号,包括:
当检测到窄带语音信号时,对所述窄带语音信号进行上采样处理;
对上采样处理后的窄带语音信号进行分帧处理;
分别对分帧后的每一帧语音信号进行加窗处理;
分别对加窗处理后的每一帧语音信号进行快速傅里叶变换,获得每一帧语音信号的频谱;
根据每一帧语音信号的频谱分别估计每一帧语音信号的最高频率;
根据每一帧语音信号的最高频率分别确定其对应的谱平移的子带,并分别基于其最高频率向上填充频谱,直至频谱补充完成,得到每一帧语音信号的第二频谱;
对每一帧语音信号的第二频谱进行逆傅里叶变换,得到伪高频信号。
6.根据权利要求5所述的基于深度学习注意力机制的频带扩展方法,其特征在于,估计当前帧最高频率的方法包括:
计算设定频率范围内的平均功率谱能量,并取所述平均功率谱能量的1/N作为能量阈值,以估计当前帧的最高频率;其中,N大于1;
从所述设定频率范围的最高频率往下逐一检索,若检索到某一频率对应的功率谱能量大于所述能量阈值,则所述某一频率为所述当前帧的最高频率。
7.根据权利要求5所述的基于深度学习注意力机制的频带扩展方法,其特征在于,根据当前帧的最高频率确定其谱平移的子带,包括:
设最高频率为Q,取[Q-1000,Q]Hz范围的子带作为谱平移的子带。
8.根据权利要求6所述的基于线性性滤波的频带扩展方法,其特征在于,当将8kHz的窄带语音信号扩展成16kHz的宽语音带信号时,所述设定频率为2kHz~4kHz,所述N等于8。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010933415.X/1.html,转载请声明来源钻瓜专利网。