[发明专利]语音识别装置以及语音识别方法无效

申请号：	03157364.9	申请日：	2003-09-18
公开（公告）号：	CN1492394A	公开（公告）日：	2004-04-28
发明（设计）人：	外山聪一	申请（专利权）人：	日本先锋公司
主分类号：	G10L15/00	分类号：	G10L15/00
代理公司：	北京三友知识产权代理有限公司	代理人：	李辉
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明的语音识别装置和语音识别方法目的在于减低杂音适应处理和发话者适应处理时的处理量。事先记忆代表语音模型C和差分模型D。实行语音识别前，对代表语音模型C施行杂音适应处理以生成杂音适应代表语音模型C^N，再通过合成差分模型D生成实施过杂音适应处理的合成语音模型M。根据发话语音的特征矢量系列对上述模型M实行发话者适应处理以生成杂音发话者适应语音模型R。接着，从模型R与模型C^N之间的差分生成更新差分模型D”，以更新差分模型D”更新差分模型D。语音识别时，通过把模型C与模型D”进行对照来生成实施过杂音适应处理以及发话者适应处理的合成语音模型M”，对被识别的发话者语音的特征矢量系列进行校对实行语音识别。
搜索关键词：	语音识别装置以及方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音识别装置，其将实施了杂音适应处理和发话者适应处理的合成语音模型与自发话时的发话语音求得的特征矢量系列进行对照来实行语音识别，其特征在于包括：记忆手段，其通过小组化或群集化且根据类似性把多数的语音模型分类成若干小组，且能够预先记忆自通过小组化或群集化而属于同一小组的每个小组的语音模型代表性地求得的各小组的代表语音模型、通过按上述各同一小组来求得属于上述各组的语音模型与上述代表语音模型之间的差分而得到的且属于各小组的差分模型、使上述代表语音模型和差分模型对应于各同一小组的小组信息；杂音适应代表语音模型生成手段，其通过对记忆在上述记忆手段中的每个同一小组的代表语音模型实行杂音适应处理来生成杂音适应代表语音模型；合成语音模型生成手段，其根据上述小组信息按上述每个同一小组把属于上述各小组的上述差分模型与上述杂音适应代表语音模型进行合成，从而生成每个同一小组的合成语音模型；更新模型生成手段，其对于实施过上述杂音适应处理的上述每个同一小组的合成语音模型，根据自发话语音求得的特征矢量系列施行发话者适应处理，从而生成杂音发话者适应语音模型；模型更新手段，从上述杂音发话者适应语音模型与根据上述小组信息选择的上述杂音发话者适应语音模型所属的小组的上述杂音适应代表语音模型之间的差分来生成上述每个同一小组的更新差分模型，同时按照该生成的更新差分模型来更新上述记忆手段中记忆的每个同一小组的差分模型；在语音识别时，通过对根据上述小组信息选择的上述更新差分模型所属的小组的上述代表语音模型实施杂音适应处理来生成杂音适应代表语音模型，同时将杂音适应代表语音模型与上述更新的更新差分模型进行合成来生成实施过杂音适应处理和发话者适应处理的合成语音模型，并且通过把该合成语音模型与自要被识别的发话者语音求得的特征矢量系列进行对照来实行上述语音识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于日本先锋公司，未经日本先锋公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/03157364.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别装置以及语音识别方法无效

专利文献下载