[发明专利]改进噪声环境和频率失谐条件下话音识别性能的系统和方法无效
申请号: | 01818337.9 | 申请日: | 2001-10-25 |
公开(公告)号: | CN1473323A | 公开(公告)日: | 2004-02-04 |
发明(设计)人: | H·加鲁达德里 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 上海专利商标事务所 | 代理人: | 李家麟 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 通过改善语音识别系统10的语音识别器,实现了一种可以改善语音识别性能的方法和系统。为了减少附加噪声效应提高语音识别系统的准确度,采用了吠声振幅的μ律压缩20。采用吠声振幅的A律压缩,来提高语音识别器的准确度。在语音识别器中,可以同时采用μ律压缩20和μ律扩展22,来提高语音识别器的准确度。在语音识别器中,可以同时采用A律压缩21和A律扩展,来提高语音识别器的准确度。 | ||
搜索关键词: | 改进 噪声 环境 频率 失谐 条件下 话音 识别 性能 系统 方法 | ||
【主权项】:
1.一种分布式语音识别系统的语音识别器,其特征在于,它包括:配置用于将数字化语音信号转变为吠声(bark)振幅的吠声振幅生成模块;与吠声振幅生成模块相连接的μ-log压缩模块,所述μ-log压缩模块用以对吠声振幅执行μ-log压缩;与所述μ-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对μ-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的对数倒频谱转换模块,所述对数倒频谱转换模块用于生成J静态对数倒频谱系数以及J动态对数倒频谱系数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/01818337.9/,转载请声明来源钻瓜专利网。