[发明专利]一种基于联合字典学习和稀疏表示的骨导语音增强方法在审
申请号: | 202010810196.6 | 申请日: | 2020-08-13 |
公开(公告)号: | CN111968627A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 叶中付 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L21/02;G10L21/0224;G10L21/0316;G10L25/18;G10L25/27 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联合 字典 学习 稀疏 表示 导语 增强 方法 | ||
本发明提供一种基于联合字典学习和稀疏表示的骨导语音增强方法。训练阶段,在室内无噪环境中,用骨导麦克风和气导麦克风组成的异型双麦克风阵列同步采集训练语音,构建骨导语音和气导语音的联合训练集;对骨导语音和气导语音的训练信号做短时傅里叶逆变换得到时频谱幅度,在时频谱上学习骨导语音和气导语音的联合语音字典。检测阶段,对于骨导语音进行短时傅里叶变换得到时频谱幅度和相位,将幅度在联合语音字典的骨导语音子字典上进行投影,用得到的稀疏表示系数与联合语音字典的气导语音子字典一起重建气导语音时频谱幅度,并提供两种方法用于增强骨导语音时频谱,最后做短时傅里叶逆变换,得到增强后的骨导语音时域信号,从而提高语音清晰度。
技术领域
本发明涉及单通道语音增强领域,尤其涉及一种基于联合字典学习和稀疏表示的骨导语音增强方法。
背景技术
在人们的交流活动中,语音发挥着主导作用。由于受到环境噪声的污染,人耳和包含空气传导麦克风(简称气导麦克风)的相关智能装置收到的是带噪语音,语音的质量和可懂度会有明显的下降,影响了人们的主观听觉感受和智能装置的语音识别率。语音增强技术就是解决这类问题的主要方法。如何从带噪语音中恢复出干净语音一直都是人们试图解决的问题。气导麦克风接收的语音简称为气导语音。
骨导麦克风是另一种非声传感器,其语音传输通道能够屏蔽环境噪声,抗噪性能好。然而人体传导的低通性能以及传感器工艺水平的限制等因素,导致骨导麦克风接收的语音清晰度低,听起来比较沉闷。骨导麦克风接收的语音简称骨导语音。
针对骨导语音的增强对于在强噪声环境下的语音通信应用具有重要的现实意义。
发明内容
尽管骨导麦克风具有抗噪性能好的特点,但其语音的时频谱信息不丰富,听起来比较沉闷。针对这一问题,本发明提供一种基于联合字典学习和稀疏表示的骨导语音增强方法。专门设计了骨导麦克风和气导麦克风组成的异型双麦克风阵列,同步采集说话人训练语音,构建骨导语音和气导语音的联合训练集,在时频谱上学习骨导语音和气导语音对应特征的联合语音字典,骨导语音子字典和气导语音子字典通过稀疏表示系数约束,在子字典的对应原子上,气导语音子字典比骨导语音子字典的频谱信息更丰富。用待检测骨导语音在骨导语音子字典上投影得到的最优稀疏表示系数与气导语音子字典一起重建气导语音时频谱,该重建气导语音时频谱具有更丰富的频谱信息,用于补充骨导语音的缺失信息,达到提高骨导语音的清晰度的目的。
本发明的目的是通过以下技术方案实现的:
一种基于联合字典学习和稀疏表示的骨导语音增强方法,包括:
训练阶段,在室内无噪环境下用骨导麦克风和空气传导麦克风组成的异型双麦克风阵列同步采集训练语音,构建骨导语音和气导语音的联合训练集;对骨导语音和气导语音的训练信号分别做短时傅里叶逆变换,提取其时频谱的幅度,在时频谱上学习骨导语音和气导语音对应特征的联合语音字典。
检测阶段,对于待检测骨导语音进行短时傅里叶变换,提取时频谱的幅度和相位;将时频谱幅度在联合语音字典中的骨导语音子字典上进行投影,得到最优稀疏表示系数;用得到稀疏表示系数与联合语音字典的气导语音子字典一起重建气导语音时频谱的幅度,并与待检测骨导语音相位一起来增强骨导语音时频谱,最后做短时傅里叶逆变换,得到增强后的骨导语音时域信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010810196.6/2.html,转载请声明来源钻瓜专利网。