[发明专利]语音模型的噪声适应系统及方法,语音识别的噪声适应程序有效
申请号: | 200410077161.7 | 申请日: | 2004-09-10 |
公开(公告)号: | CN1595497A | 公开(公告)日: | 2005-03-16 |
发明(设计)人: | 古井贞熙;張志鹏;堀越力;杉村利明 | 申请(专利权)人: | 古井贞熙;株式会社NTT都科摩 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/20;G10L15/00;G10L21/02 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 王萍 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的是通过对语音识别产生具有单个树形结构的语音模型并且使用该模型便利对带有变化SNR的有噪声语音的处理和节省计算成本。在每个SNR条件下使用噪声数据库中存储的每段噪声数据计算具有该SNR条件的所有噪声模型之间的距离并且群集添加噪声的语音。根据该群集的结果,产生一个集成噪声和SNR的单个树形结构模型空间(步骤S1至S5)。在噪声提取步骤(步骤S6),分析要识别的输入有噪声语音以提取特征参数串并且彼此比较各HMM的似然性,以从该树形结构有噪声语音模型空间选择一个最优模型(步骤S7)。对该选出的有噪声语音模型空间施加线性变换以使似然性最大化(步骤S8)。 | ||
搜索关键词: | 语音 模型 噪声 适应 系统 方法 识别 程序 | ||
【主权项】:
1.一种语音模型的噪声适应系统,用于在噪声环境下使得用于任何噪声的语音模型适应要被识别的语音,所述语音模型是通过利用噪声数据库中存储的噪声数据以及干净语音数据学习的,所述系统包括:用于群集所述噪声数据库中存储的所有噪声数据的群集装置;用于根据由所述群集装置执行的群集的结果产生单个树形结构有噪声语音模型空间的语音模型空间产生装置;用于提取要被识别的输入有噪声语音的语音特征参数的参数提取装置;用于从由所述语音模型空间产生装置产生的树形结构有噪声语音模型空间选择一个最优模型的选择装置;以及用于对由所述选择装置选择的模型施加线性变换以使所述模型提供进一步增加的似然性的线性变换装置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于古井贞熙;株式会社NTT都科摩,未经古井贞熙;株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200410077161.7/,转载请声明来源钻瓜专利网。
- 上一篇:热交换器
- 下一篇:图像读出装置及X射线摄影装置