[发明专利]一种基于深度学习的阶梯式语音增强方法有效
申请号: | 202011359400.3 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112562710B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 胡静;万里;王建荣;刘李 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 霍慧慧 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 阶梯 语音 增强 方法 | ||
本发明涉及一种基于深度学习的阶梯式语音增强方法,其特征在于:所述方法的步骤为:a)一阶合适机器感知框架的建立;b)二阶适合人耳听觉感知框架建立。本发明设计科学合理,说提出的基于阶梯式方法的有效性,既能得到适合机器感知的语音,又能得到适合人耳感知的语音。
技术领域
本发明属于语音信号处理领域,涉及信号处理技术,特别涉及一种基于深度学习的阶梯式语音增强方法。
背景技术
语音是人类相互传递信息最基本也是最重要的方式,语言是人类特有的能力,声音是语言传递信息最重要的工具。现今人机交互成为了未来发展的一个重要台阶,语音作为人机交互的门面现在的地位越发的重要,所以对于一个优秀的人机交互系统来说,优秀的语音前端发挥着不可替代的作用。在现实生活中,我们所处的环境时时刻刻都充斥着噪声,因此更好的背景噪声抑制方案,能更有利于人机交互,人人交互。
自动语音识别(Automatic Speech Recognition,ASR)\cite{hermus2006review}是利用信号处理和模式识别技术将语音信号转换为文本信息。当今越来越多的产品使用到了语音识别技术,在一定程度上而言语音识别是未来人机交互最重要的基石。近十多年随着科技的发展,特别是2009年以来,依托于计算机算力的深度学习和机器学习及大数据技术的飞速发展,奠定了语音识别落地化的基础,并且已经在市场上取得了非凡的成果。各大互联网公司争先恐后的开发各种语音服务,尤其是手机移动端的语音识别已经深入我们的日常生活。
国内外对语音产品化落地高度重视,国外苹果公司开发的Siri是苹果公司内嵌在其各个设备上的语音助手。用户自身可以利用Siri调用系统自身应用来查询实时信息。再如Assistant(谷歌语音助手)、Cortana(微软语音助手)以及Alexa(亚马逊语音助手)都是目前国外系统比较完善的的语音系统。国内研究语音识别研究虽然不如国外早,但现如今国内语音市场也达到了空前的繁荣地步,主要产品载体就是现今应用广泛的智能音箱,如天猫精灵、小度智能音响等。但现实场景的多变性使得语音识别在很多场景下不能有很好的作用,如当前我们使用的小艾音箱在较为嘈杂的场景中不能准确的做出相应的判断,车载语音识别系统在车速较高的场景中不能很好的识别出的说话内容,再如在吵杂的场景中人工耳蜗不能很好的适应噪声,使得听障人事不能很好的根据听觉判他人说话内容等。所以提高在复杂场景下的语音信号水平,能够在很大程度上帮助提升语音识别准备率和人耳感知感知评判水平。
提升语音质量的关键技术就是增强目标信号的感知强度,即语音增强,其本质是抑制噪声信号表达,从而增强目标语音内容。一方面语音增强能够更好表达带噪语音信号中的目标信号的感知强度从而提升带噪信号的听觉感知强度和增加其可懂度,另一方面能够提升增强后语音在其他应用上的鲁棒性。现今深度学习呼声越来越高,相较于传统的信号处理的方法,深度学习在信号领域带来了非常大的增益。特别是相较于传统的信号处理方法,深度学习对于非静态噪声的抑制表现出了很好的语音分离效果。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于深度学习的阶梯式语音增强方法,通过该方法能够得到不仅适合机器感知的增强语音信号,进一步在此基础上能够得到适合人耳听觉感知的语音信号。
本发明解决其技术问题是通过以下技术方案实现的:
一种基于深度学习的阶梯式语音增强方法,其特征在于:所述方法的步骤为:
a)一阶合适机器感知框架的建立:
步骤S1、对语音信号进行分帧及加窗处理,再进行短时傅里叶变换,将时序信号变换频域信号;
步骤S2、设计启发式输入方式,将输入集中于低频区域,增强低频区的感知强度,具体表达如下公式所示:
Y=(Yi×signal(Yi,…,Yn),Yi,…,Yn)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011359400.3/2.html,转载请声明来源钻瓜专利网。