[发明专利]基于深度学习注意力机制的频带扩展方法及装置在审
申请号: | 202010933415.X | 申请日: | 2020-09-08 |
公开(公告)号: | CN112233685A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 方泽煌;康元勋 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
主分类号: | G10L19/022 | 分类号: | G10L19/022;G10L19/26;G10L25/18;G10L25/27;G10L25/45 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;麦小婵 |
地址: | 361009 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 注意力 机制 频带 扩展 方法 装置 | ||
本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置,所述方法包括:基于窄带语音信号生成伪高频信号;计算所述伪高频信号的功率谱能量;通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。本发明实施例既保证了扩频效果,保证语音质量,还可应用部署于要求时延低,内存小、计算能力较弱的通信设备。
技术领域
本发明涉及音频信号处理技术领域,尤其涉及一种基于深度学习注意力机制的频带扩展方法及装置。
背景技术
语音信号的中高频段成分蕴含着丰富的声学信息,这些声学信息直接影响语音信号的音色、自然度、清晰读、可懂度等。中高频段语音信号的缺失会导致语音质量严重下降,例如会使得声音变得低沉、降低了原有自然语音信号的表现力。
在目前的公共交换电话网(Public Switched Telephone Networks)和一些无线通信系统中,由于受到信道带宽、编码方式等多方面因素的影响,语音信号在通信过程中仅仅能够保留低频(0.3kHz-3.4kHz)部分进行传输,导致语音质量受到严重的影响。
频带扩展技术是一种参数编码技术,通过频带扩展可以在接收端实现恢复或扩展出高频成分,以提高音频信号的质量,使用户直观感受到更亮的音色,更大的音量和更好的可懂度。通过深度学习实现频带扩展是目前的研究热点之一,但是,目前的基于深度学习的频带扩展方法是利用大量的数据进行模型的拟合窄带语音信号到宽带语音信号的映射,因此需要动用大量的参数,而动则几十兆至上百兆的模型规模是要求时延低,内存小、计算能力较弱的终端系统,如会议终端系统所不能承受的,同时投入的各种资源也让各中小企业忘而却步。
因此,如何解决现有深度学习模型参数规模大、计算开销大导致基于其的频带扩展方法无法应用在要求时延低,内存小、计算能力较弱的终端系统是亟需解决的技问题。
发明内容
本发明提供一种基于深度学习注意力机制的频带扩展方法及装置,以解决由于现有深度学习模型参数规模大、计算开销大导致基于其的频带扩展方法无法应用在会议终端系统的技问题,能够通过参数规模小、结构简单的深度学习模型实现频带扩展。
第一方面,本发明实施例提供一种基于深度学习注意力机制的频带扩展方法,包括:
基于窄带语音信号生成伪高频信号;
计算所述伪高频信号的功率谱能量;
通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;
将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;
对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。
优选地,所述逆滤波参数估计模型包括输入层、第一Dense层、第一GRU层、第二GRU层、Attention层、第二Dense层以及输出层;其中,所述第一Dense层接收所述输入层输出的数据,所述第一GRU层接收所述第一Dense层输出的数据,所述第二GRU层接收所述第一GRU层输出的数据,所述Attention层接收所述第一GRU层输出的数据和所述第二GRU层输出的数据,所述第二Dense层接收所述Attention层输出的数据和所述第一GRU层输出的数据。
优选地,所述逆滤波参数估计模型通过采用Adam训练策略和改进的loss函数训练得到,所述改进的loss函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010933415.X/2.html,转载请声明来源钻瓜专利网。