[发明专利]一种声纹特征识别方法及系统在审
申请号: | 201611075677.7 | 申请日: | 2016-11-29 |
公开(公告)号: | CN106782565A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 徐晓东;张程;张毅 | 申请(专利权)人: | 重庆重智机器人研究院有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/26 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 唐维虎 |
地址: | 400000 重庆市*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 特征 识别 方法 系统 | ||
技术领域
本发明涉及声音识别技术领域,具体而言,涉及一种声纹特征识别方法及系统。
背景技术
早在20世纪30年代,声纹识别的研究就已经在信息科研工作者中展开了。在早期研究中,人耳听辨(Aural)实验和听音识别可行性验证是声纹识别领域的重点。随着计算机科技在硬件和算法中的突破,声纹识别的研究不再仅仅局限于单一的人耳听辨。美国Bell实验室在语音识别领域长期处于领先位置,实验室成员L G.Kesta通过对语音频谱图的分析完成识别,并由他首先提出了“声纹识别”这个概念。随着科研工作者在声纹识别领域不断的探索和创新,使机器自动分析并识别人类语音信号变成可能。但是,目前已有的声纹特征识别方法在噪声环境下的识别准确率都普遍较低,系统鲁棒性差,应用效果不佳。
发明内容
本发明的目的在于提供一种声纹特征识别方法及系统,以改善上述问题。
本发明较佳实施例提供一种声纹特征识别方法,该方法包括:
对输入的原始语音信号进行预处理,所述预处理包括预加重、分帧加窗以及端点检测;
对预处理后得到的含噪混合信号进行基于听觉特性的语音分离处理;
提取经语音分离处理后的信号的频率倒谱系数和感知线性预测系数;
利用噪声背景区分度,在不同噪声环境下对频率倒谱系数和感知线性预测系数进行分析以完成特征融合;及
在预先建立的声纹特征模板库中,采用高斯混合模型-通用背景模型对已完成融合的特征进行模式匹配,实现声纹特征识别。
本发明另一实施例提供一种声纹特征识别系统,该系统包括:
预处理模块,用于对输入的原始语音信号进行预处理,所述预处理包括预加重、分帧加窗以及端点检测;
语音分离模块,用于对预处理后得到的含噪混合信号进行基于听觉特性的语音分离处理;
特征提取模块,用于提取经语音分离处理后的信号的频率倒谱系数和感知线性预测系数;
特征融合模块,用于利用噪声背景区分度,在不同噪声环境下对频率倒谱系数和感知线性预测系数进行分析以完成特征融合;及
特征识别模块,用于在预先建立的声纹特征模板库中,采用高斯混合模型-通用背景模型对已完成融合的特征进行模式匹配,实现声纹特征识别。
本发明实施例提供的声纹特征识别方法及系统,将人类听觉系统特性与传统声纹识别方法相结合,从仿生学角度解决噪声下声纹识别率降低的问题,有效提升了噪声环境下声纹识别的准确率和系统的鲁棒性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种语音识别设备的方框示意图;
图2为本发明实施例提供的一种声纹特征识别方法的流程图;
图3为本发明实施例提供的双耳时间差的几何原理图;
图4为本发明实施例提供的一种声纹特征识别系统的功能模块框图。
图标:100-语音识别设备;110-声纹特征识别系统;120-存储器;130-处理器;1102-预处理模块;1104-语音分离模块;1106-特征提取模块;1108-特征融合模块;1110-特征识别模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆重智机器人研究院有限公司,未经重庆重智机器人研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611075677.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于处理语音数据的方法和装置
- 下一篇:收集个人声音特征的方法