[发明专利]一种无监督单传声器语音降噪方法及系统有效
申请号: | 201710137778.0 | 申请日: | 2017-03-09 |
公开(公告)号: | CN108574911B | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 李军锋;李煦;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | H04R3/04 | 分类号: | H04R3/04 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;陈琳琳 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种无监督单传声器语音降噪方法,所述方法包括:步骤1)对采集的覆盖所有音素的语音训练数据的进行频谱提取,然后对幅度谱进行k均值聚类,得到每个类别对应的语音字典;然后将所有不同类别的语音字典组合成一个完备的语音字典WS;步骤2)对当前时刻到达的带噪信号进行短时傅里叶变换得到当前帧幅度谱xt,再和前L帧已经处理过的幅度谱结合作为输出语音谱X=[xt‑L,...,xt‑1,xt],将前一帧估计得到的噪声矩阵WN和语音字典WS结合为总的字典矩阵W=[WS WN],采用迭代的算法对输出语音谱X进行非负矩阵分解,得到噪声矩阵 |
||
搜索关键词: | 语音字典 噪声矩阵 幅度谱 降噪 权重向量 输出语音 语音 传声器 无监督 噪声 短时傅里叶变换 矩阵 语音训练数据 带噪信号 非负矩阵 频谱提取 语音信号 前一帧 迭代 算法 音素 重构 字典 采集 分解 覆盖 | ||
【主权项】:
1.一种无监督单传声器语音降噪方法,所述方法包括:步骤1)对采集的覆盖所有音素的语音训练数据的进行频谱提取,然后对幅度谱进行k均值聚类,得到每个类别对应的语音字典;然后将所有不同类别的语音字典组合成一个完备的语音字典WS;步骤2)对当前时刻到达的带噪信号进行短时傅里叶变换得到当前帧幅度谱xt,再和前L帧已经处理过的幅度谱结合作为输出语音谱X=[xt‑L,...,xt‑1,xt],将前一帧估计得到的噪声矩阵WN和语音字典WS结合为总的字典矩阵W=[WS WN],采用迭代的算法对输出语音谱X进行非负矩阵分解,得到噪声矩阵
和当前帧对应的语音噪声权重向量
步骤3)通过估计得到的噪声矩阵
和语音噪声权重向量
重构出降噪后的当前帧语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710137778.0/,转载请声明来源钻瓜专利网。