[发明专利]基于单麦克风的人声提取方法及装置在审
申请号: | 201610098307.9 | 申请日: | 2016-02-23 |
公开(公告)号: | CN105719657A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 肖观送;黄锦昌 | 申请(专利权)人: | 惠州市德赛西威汽车电子股份有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10K11/178 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈卫;禹小明 |
地址: | 516006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 麦克风 人声 提取 方法 装置 | ||
技术领域
本发明涉及声音处理领域,特别涉及一种基于单麦克风的人声提取方法和装置。
背景技术
目前,语音识别中一般的降噪方案是加入独立的降噪模块,这种降噪模块一般采用双麦克风的主动降噪技术,即副麦克风的噪声信号相位经过反向再与主麦克风中的噪声信号相加,从而对噪声信号起到抑制的作用。但是该方案需要独立的降噪模块和两个麦克风,成本较高。对双麦克风的安装也有一定的要求,增加了安装的复杂性。以及在多人说话环境下难以区分出真正用户,造成低识别率。模块开发者在开发时需要开发复杂的算法保证两个麦克风进入的声音信号在进行处理时的时序一致。
发明内容
本发明的目的是为了克服上述背景技术的缺陷,提供一种基于单麦克风的人声提取方法和装置。
一种基于单麦克风的人声提取方法,包括具有至少一个麦克风的人声提取装置,所述采集系统还包括用于处理所述麦克风获取的声音信号的音频信号处理器以及语音识别内核,所述音频信号处理器提取人声具体步骤包括如下:
S10、对获取的至少一路声音信号做模数转换,获得原声音信号;
S20、对声音信号每个时频点进行分析统计,根据预先的人声预提取方法获得的用户声音特征提取初步人声信号;
S30、将所述初步人声信号进行相位相反,并与所述原声音信号相加,获得噪声信号;
S40、将所述噪声信号进行相位相反,并与所述原声音信号相加,获得最终人声信号;
所述人声与提取方法为在低噪声的环境中进行语音特征参数提取法。
进一步的,还包括:
S50、对最终人声做信号增益处理;
S60、将增益处理后的最终人声信号发送到语音识别内核。
其中,所述特征参数提取法包括如下步骤:
S201、对声音信号进行抗混叠滤波;
S202、对步骤S201获得的信号进行模数转换;
S203、对步骤S202获得的信号进行高通滤波;
S204、对步骤S203获得的信号进行做分帧处理;
S205、采用哈明窗口对步骤S204获得的每帧数据进行加窗处理;
S206、对步骤S205获得的信号做频域转换;
S207、对步骤S206获得的信号进行三角窗滤波;
S208、对步骤S207获得的信号进行对数运算;
S209、对步骤S208获得的信号做离散余弦变换;
S210、对步骤S209获得的信号进行谱加权;
S211、对步骤S210获得的信号做倒谱均值减处理;
S212、在步骤S211获得的信号加入表征语音动态特性的差分参数,获得用户声音特征。
优选的,所述人声提取装置采用一个麦克风。
另外,本发明还提供一种基于上述人声提取方法的单麦克风人声提取装置包括一个麦克风,与所述麦克风连接的声音信号处理器以及用于识别语音的语音识别内核,所述声音信号处理器包括用于对获取的声音信号做模数转换的模块、用于对声音信号每个时频点进行分析统计的模块、用于做预先的人声预提取方法的模块以及用于对声音信号进行反向和/或相加的模块。
优选的,所述声音处理器还包括用于多声音信号做增益处理的模块。
本发明对人声信号进行采样量化,再与系统获取到具有用户声音特征的声学模型对比,提取出用户声音信号,并在过滤了噪声信号的信号中再次提取出人声信号。由于经过了一次噪声抑制,提取出的人声信号更加纯净,可以最大限度提取出用户声音,并且每个人声音特征存在差异性,根据这个特征还可以过滤周围人发出的声音。
附图说明
图1为本发明的人声提取方法的方法流程图。
图2为本发明的特征参数提取法的步骤流程图。
图3为本发明的单麦克风人声提取装置构架原理图。
具体实施方式
下面将结合附图对本发明的基于单麦克风的人声提取方法和装置作进一步的描述。
一种基于单麦克风的人声提取方法,包括具有一个麦克风的人声提取装置,采集系统还包括用于处理麦克风获取的声音信号的音频信号处理器以及语音识别内核,如图1所示。音频信号处理器提取人声具体步骤包括如下:
S10、对获取的单路声音信号做模数转换,将原始的模拟声音信号转换成数字信号,从而获得待处理的原声音信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠州市德赛西威汽车电子股份有限公司,未经惠州市德赛西威汽车电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610098307.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于声纹识别的录音文件分离方法及装置
- 下一篇:声音检索装置、声音检索方法