[发明专利]一种基于联合字典学习和稀疏表示的骨导语音增强方法在审

申请号：	202010810196.6	申请日：	2020-08-13
公开（公告）号：	CN111968627A	公开（公告）日：	2020-11-20
发明（设计）人：	叶中付	申请（专利权）人：	中国科学技术大学
主分类号：	G10L15/06	分类号：	G10L15/06;G10L21/02;G10L21/0224;G10L21/0316;G10L25/18;G10L25/27
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	杨学明
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于联合字典学习稀疏表示导语增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于联合字典学习和稀疏表示的骨导语音增强方法。训练阶段，在室内无噪环境中，用骨导麦克风和气导麦克风组成的异型双麦克风阵列同步采集训练语音，构建骨导语音和气导语音的联合训练集；对骨导语音和气导语音的训练信号做短时傅里叶逆变换得到时频谱幅度，在时频谱上学习骨导语音和气导语音的联合语音字典。检测阶段，对于骨导语音进行短时傅里叶变换得到时频谱幅度和相位，将幅度在联合语音字典的骨导语音子字典上进行投影，用得到的稀疏表示系数与联合语音字典的气导语音子字典一起重建气导语音时频谱幅度，并提供两种方法用于增强骨导语音时频谱，最后做短时傅里叶逆变换，得到增强后的骨导语音时域信号，从而提高语音清晰度。

技术领域

本发明涉及单通道语音增强领域，尤其涉及一种基于联合字典学习和稀疏表示的骨导语音增强方法。

背景技术

在人们的交流活动中，语音发挥着主导作用。由于受到环境噪声的污染，人耳和包含空气传导麦克风(简称气导麦克风)的相关智能装置收到的是带噪语音，语音的质量和可懂度会有明显的下降，影响了人们的主观听觉感受和智能装置的语音识别率。语音增强技术就是解决这类问题的主要方法。如何从带噪语音中恢复出干净语音一直都是人们试图解决的问题。气导麦克风接收的语音简称为气导语音。

骨导麦克风是另一种非声传感器，其语音传输通道能够屏蔽环境噪声，抗噪性能好。然而人体传导的低通性能以及传感器工艺水平的限制等因素，导致骨导麦克风接收的语音清晰度低，听起来比较沉闷。骨导麦克风接收的语音简称骨导语音。

针对骨导语音的增强对于在强噪声环境下的语音通信应用具有重要的现实意义。

发明内容

尽管骨导麦克风具有抗噪性能好的特点，但其语音的时频谱信息不丰富，听起来比较沉闷。针对这一问题，本发明提供一种基于联合字典学习和稀疏表示的骨导语音增强方法。专门设计了骨导麦克风和气导麦克风组成的异型双麦克风阵列，同步采集说话人训练语音，构建骨导语音和气导语音的联合训练集，在时频谱上学习骨导语音和气导语音对应特征的联合语音字典，骨导语音子字典和气导语音子字典通过稀疏表示系数约束，在子字典的对应原子上，气导语音子字典比骨导语音子字典的频谱信息更丰富。用待检测骨导语音在骨导语音子字典上投影得到的最优稀疏表示系数与气导语音子字典一起重建气导语音时频谱，该重建气导语音时频谱具有更丰富的频谱信息，用于补充骨导语音的缺失信息，达到提高骨导语音的清晰度的目的。

本发明的目的是通过以下技术方案实现的：

一种基于联合字典学习和稀疏表示的骨导语音增强方法，包括：

训练阶段，在室内无噪环境下用骨导麦克风和空气传导麦克风组成的异型双麦克风阵列同步采集训练语音，构建骨导语音和气导语音的联合训练集；对骨导语音和气导语音的训练信号分别做短时傅里叶逆变换，提取其时频谱的幅度，在时频谱上学习骨导语音和气导语音对应特征的联合语音字典。

检测阶段，对于待检测骨导语音进行短时傅里叶变换，提取时频谱的幅度和相位；将时频谱幅度在联合语音字典中的骨导语音子字典上进行投影，得到最优稀疏表示系数；用得到稀疏表示系数与联合语音字典的气导语音子字典一起重建气导语音时频谱的幅度，并与待检测骨导语音相位一起来增强骨导语音时频谱，最后做短时傅里叶逆变换，得到增强后的骨导语音时域信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010810196.6/2.html，转载请声明来源钻瓜专利网。

上一篇：基于人工智能的飞机油量测量方法及系统
下一篇：轴带推进机构中轴带电机的故障检测方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于联合字典学习和稀疏表示的骨导语音增强方法在审

专利文献下载