[发明专利]用于语音活动检测的听觉特征提取方法有效
申请号: | 201710578645.7 | 申请日: | 2017-07-14 |
公开(公告)号: | CN107393553B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 蔡钢林 | 申请(专利权)人: | 深圳永顺智信息科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/78;G10L21/0224;G10L21/0208;G10L15/20 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 活动 检测 听觉 特征 提取 方法 | ||
本发明提出一种用于语音活动检测的听觉特征提取方法,包括以下步骤:计算声音信号的时域信号;利用所述时域信号,计算所述声音信号的先验信噪比γ(k)和后验信噪比ε(k),其中,k为频率坐标;根据所述时域信号、先验信噪比γ(k)和后验信噪比ε(k)计算当前帧的听觉特征,其中,所述听觉特征包括第一维度参数,第二维度参数和第三维度参数;所述第一维度参数与所述先验信噪比γ(k)相关,第二维度参数与所述后验信噪比ε(k)相关,第三维度参数与所述时域信号相关。本发明采用先验信噪比、后验信噪比联合时域信号表征听觉特征,提取的听觉特征可用于与听觉阈值比较,检测实时的语音活动。
技术领域
本发明涉及到语音识别领域,特别是涉及到一种用于语音活动检测的听觉特征提取方法。
背景技术
近年来随着互联网技术、智能硬件的蓬勃发展,语音识别、声纹识别、声源检测等语音智能交互技术开始从实验室走向用户。由于语音识别技术是基于语音的人机交互系统最核心的技术。目前在限定条件下识别率已经达到可用的准确率。所谓限定调节通常是指用户距离麦克风较近,噪声干扰较小。而必须近距离发出语音指令这一条件限制了语音交互的便捷性。
在远讲情况下,由于语音能量会快速衰减,而噪音干扰能量大致不变,会使得识别率迅速下降。另外一个影响识别准确率的因素是,语音指令到达房间墙壁多次反射之后的混响,也会造成实际应用与语音识别训练数据集的不匹配,影响识别率。
噪音主要有两个来源:(1)麦克风信号采集系统自带的信道噪声,信道噪声因麦克风的敏感性而不同,麦克风敏感性越高,通常信道噪声越高;(2)不可忽略的环境噪声干扰,比如电视机、空调噪声等等。相比于噪声,混响由于产生条件更为复杂,更难抑制。并且,噪音和混响一般同时存在,使得混响抑制更加困难。
CN103559893A公开了一种水下目标gammachirp倒谱系数听觉特征提取方法,使用gammachirp听觉滤波器组输出形成倒谱系数,给出水下目标的听觉特征矢量,可在复杂海洋环境干扰条件下,提高水下目标信号特征提取的稳健性,从而提高水下目标识别的正确率。
解决远讲情况下的语音识别问题,需要准确地提取出在远讲情况下的听觉特征。然而,CN103559893A提供的方法,其提取的听觉特征仅限于水下环境,并不适用于远讲情况下的语音识别。
现有的还有一种超定向Beamforming技术,其采用环形或者线形麦克风阵列,通过一组空域滤波器,定向增强目标声源方向信号。超定向Beamforming技术是从采样方面提高声音信号的质量。但是,采用超定向Beamforming技术,需要麦克风的数量比较多,并且对麦克风的一致性、麦克风的几何位置的精确度要求很高,增加了硬件上实现的难度和成本,很难在大多数中、低层次产品中集成,应用范围非常局限。
发明内容
本发明的主要目的为提供一种用于语音活动检测的听觉特征提取方法,可在单麦克风体系下,有效地提取在远讲情况下的听觉特征,提高语音识别率。
本发明提出一种用于语音活动检测的听觉特征提取方法,包括以下步骤:
获取声音信号的时域信号;
利用所述时域信号,计算所述声音信号的先验信噪比γ(k)和后验信噪比ε(k),其中,k为频率坐标;
根据所述时域信号、先验信噪比γ(k)和后验信噪比ε(k)计算当前帧的听觉特征,其中,所述听觉特征包括第一维度参数,第二维度参数和第三维度参数;所述第一维度参数与所述先验信噪比γ(k)相关,第二维度参数与所述后验信噪比ε(k)相关,第三维度参数与所述时域信号相关。
优选地,所述第一维度参数以V(1)表示,其可由以下公式求得:
所述第二维度参数以V(2)表示,其可由以下公式求得:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳永顺智信息科技有限公司,未经深圳永顺智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710578645.7/2.html,转载请声明来源钻瓜专利网。