[发明专利]声音识别系统无效
申请号: | 01140615.1 | 申请日: | 2001-09-18 |
公开(公告)号: | CN1159703C | 公开(公告)日: | 2004-07-28 |
发明(设计)人: | 濑尾寻;驹村光弥;外山聪一 | 申请(专利权)人: | 日本先锋公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/20;G10L15/14;G10L13/00 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 黄小临;王志森 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 从含有可积性失真和可加性噪声的初始噪声HMM的声音HMM10中生成初始合成HMM16,同时由雅可比矩阵计算单元19计算雅可比矩阵J。将可积性失真的估计值Ha(cep)、可加性噪声Na(cep)和初始噪声HMM17的可加性噪声Nm(cep)合成所得的噪声变化量Namh(cep)与雅可比矩阵相乘,其中将相乘结果和初始合成HMM16进行合成,并生成自适应HMM26。从而可以事先生成与从真正讲话声音中生成的观察值序列RNa(cep)相匹配的自适应HMM26。当通过将观察值序列RNa(cep)与自适应HMM26对照进行声音识别时,抵消了可积性失真和可加性噪声的影响,其中可以获得与利用纯声音实现声音识别的情况等效的效果,并可以实现抗干扰的声音识别系统。 | ||
搜索关键词: | 声音 识别 系统 | ||
【主权项】:
1.一种声音识别系统,包括:声音模型,从事先采集的、包含可积性失真的声音中生成;噪声模型,从事先采集的可加性噪声中生成;第一估计单元,估计包含在声音模型中的可积性失真的第一估计值;合成声音模型,根据附加了噪声的声音生成,所述声音是通过合成声音模型、可积性失真的第一估计值和噪声模型的可加性噪声进行处理而得到的;计算单元,根据噪声模型的可加性噪声和附加了噪声的声音计算雅可比矩阵;第二估计单元,估计包含在讲话声音中的可积性失真的第二估计值;第一运算单元,通过将在非讲话期间生成的可加性噪声、噪声模型的可加性噪声、和第二估计单元估计的可积性失真的第二估计值合成在一起的处理,获得噪声变化量,所述第一运算单元同时将噪声变化量与计算单元计算的雅可比矩阵相乘;自适应模型,通过将第一运算单元获得的相乘结果与合成声音模型合成在一起的处理生成;和第二运算单元,通过将讲话声音与第二估计单元估计的可积性失真的第二估计值合成在一起的处理,生成观察值序列;其中,声音识别是通过将观察值序列与自适应模型相对照实现的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本先锋公司,未经日本先锋公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/01140615.1/,转载请声明来源钻瓜专利网。
- 上一篇:具有情感的语音-语音翻译系统和方法
- 下一篇:信号分析装置