[发明专利]语音识别接口装置及其语音识别方法无效
申请号: | 200810008192.5 | 申请日: | 2008-02-18 |
公开(公告)号: | CN101515456A | 公开(公告)日: | 2009-08-26 |
发明(设计)人: | 黄盈椿;金南勋 | 申请(专利权)人: | 三星电子株式会社;北京三星通信技术研究有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/08;G10L15/14;G10L15/06;G10L15/26;G10L15/28 |
代理公司: | 北京铭硕知识产权代理有限公司 | 代理人: | 韩明星;谭昌驰 |
地址: | 韩国京畿道水*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 接口 装置 及其 方法 | ||
1、一种语音识别接口装置,包括模型参数估计器和语音识别器,其特征在于,
所述模型参数估计器从外部语音数据库提取目标语言和母语的声学信息,分别训练得到目标语言的声学模型和母语的声学模型,再分别对所述两种声学模型应用模型自适应技术,然后应用高斯成分归并技术得到背景模型。
所述语音识别器分别接收从模型参数估计器输出的背景模型及从外部输入的非母语语音,基于背景模型对输入的非母语语音进行识别。
2、如权利要求1所述的语音识别接口装置,其特征在于,模型参数估计器分别选择目标语言声学模型和母语声学模型中对应的所有高斯成分进行归并。
3、如权利要求1所述的语音识别接口装置,其特征在于,语音识别器通过从背景模型中选择前M个离当前时刻非母语语音数据的距离最近的高斯成分作为描述当前时刻非母语语音数据的分布,其中,M为自然数。
4、如权利要求1所述的语音识别接口装置,其特征在于,所述模型参数估计器包括:
模型参数估计模块,基于外部语音数据库中的声学信息,输出目标语言声学模型和母语声学模型;
模型自适应模块,利用模型自适应技术,借助源自非母语语音自适应数据,调整目标语言声学模型和母语声学模型;
高斯成分归并模块,用目标语言标注母语声学模型,并将标注后的母语声学模型的高斯成分添加到目标语言声学模型上,得到背景模型;
模型参数归一化模块,用于使背景模型中的高斯成分的权值之和为1,然后将归一化后的背景模型输出到语音识别器。
5、如权利要求4所述的语音识别接口装置,其特征在于,在模型自适应模块中,执行如下操作:
从非母语语音自适应数据中估算出线性变换矩阵,将该矩阵应用到目标语言的声学模型上;
利用将目标语言和母语之间建立联系的音素映射表,用母语的音素标注自适应数据,从自适应数据中估算出线性变换矩阵,将该矩阵应用到母语声学模型上。
6、如权利要求4所述的语音识别接口装置,其特征在于,在高斯成分归并模块中,模型参数估计器分别选择目标语言声学模型和母语声学模型中所有高斯成分进行归并,得到所述背景模型。
7、如权利要求1所述的语音识别接口装置,其特征在于,所述语音识别器包括:
特征提取器,从输入的非母语语音中提取特征数据帧;
识别网格扩展模块,从特征提取器顺序接收数据帧,将隐马尔可夫模型链接,扩展成识别网络;
输出概率计算模块,基于背景模型,实时计算识别网络中每个结点所代表的状态对应的当前数据帧的输出概率值;
寻找最优路径模块,利用输出概率计算模块计算出的概率值,搜寻联合概率最大的一条路径作为当前的输出结果。
8、如权利要求7所述的语音识别接口装置,其特征在于,在输出概率计算模块中,从背景模型中对应某一状态下选择当前数据帧的输出概率值最大的前M个高斯成分,并将所选择的前M个高斯成分归一化,所述M为自然数。
9、一种语音识别方法,包括如下步骤:
(a)由目标语言和母语的声学信息分别训练得到目标语言的声学模型和母语语言的声学模型,分别对所得到的两个声学模型应用模型自适应技术,然后应用高斯成分归并技术,将目标语言声学模型和母语声学模型归并到一个声学模型中而形成背景模型;
(b)接收非母语语音输入,并基于背景模型,对所述非母语语音进行识别。
10、如权利要求9所述的语音识别方法,其特征在于,在步骤(a)中,选择目标语言声学模型和母语声学模型中所有高斯成分进行归并。
11、如权利要求9所述的语音识别方法,其特征在于,在步骤(b)中,通过从背景模型中选择前M个离非母语语音数据的马氏距离最近的高斯成分的组合作为描述非母语语音数据的分布,其中,M为自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;北京三星通信技术研究有限公司,未经三星电子株式会社;北京三星通信技术研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810008192.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:铜银分层型耐电晕换位导线
- 下一篇:一种基于支付桥实现非接触支付的系统和方法