[发明专利]语音识别装置和语音识别方法有效

专利信息
申请号: 201510601128.8 申请日: 2015-09-18
公开(公告)号: CN105529026B 公开(公告)日: 2021-01-01
发明(设计)人: 房圭燮;李昌宪 申请(专利权)人: 现代自动车株式会社
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/22
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 陈鹏;李静
地址: 韩国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 装置 方法
【说明书】:

本公开涉及语音识别装置和语音识别方法。一种语音识别装置,包括:收集器,从基于语音的装置收集第一说话者的语音数据;第一存储器,累积第一说话者的语音数据;学习器,学习累积在第一存储器中的第一说话者的语音数据并且基于所学习的知语音数据生成第一说话者的个人声学模型;第二存储器,存储通用声学模型和第一说话者的个人声学模型;特征向量提取器,当从第一说话者接收到语音识别请求时,该特征向量提取器从第一说话者的语音数据提取特征向量;以及语音识别器,基于第一说话者的语音数据的累积量来选择通用声学模型和第一说话者的个人声学模型中的任一个并且使用所提取的特征向量和所选择的声学模型来识别语音命令。

相关申请的交叉引用

本申请要求于2014年10月17日向韩国知识产权局提交的韩国专利申请第10-2014-0141167号的优先权和权益,通过引用将其全部内容结合于本文中。

技术领域

本公开涉及语音识别装置和语音识别方法。

背景技术

根据传统的语音识别方法,使用已预先存储在语音识别装置中的声学模型来执行语音识别。声学模型被用于表示说话者的语音的属性。例如,音素、双音素、三音素、五音素、音节以及字被用作声学模型的基本单位。如果将音素用作声学模型的基本模型,由于声学模型的数量减少,所以诸如双音素、三音素或五音素的上下文相关的声学模型被广泛使用以便反映相邻音素之间的变化所引起的协同发音(coarticulation)现象。需要大量数据来学习上下文相关的声学模型。

通常,将在消声室被录音的或通过服务器收集的各个说话者的声音存储作为语音数据,并且通过学习语音数据来生成声学模型。然而,在这种方法中,因为实际上使用语音识别功能的说话者的音调常常不同于与所收集的语音数据相对应的音调,故难以收集大量的语音数据并且保证语音识别性能。因此,由于通常通过学习成年男性的语音数据来生成声学模型,故难以识别具有不同的声音音调的成年女性、年长者或孩子的语音命令。

在该背景部分中公开的上述信息仅用于增强对本公开内容的背景的理解,并且因此本公开内容可以包含在该国家中未构成为本领域普通技术人员所已知的相关技术的信息。

发明内容

所创作的本公开致力于提供具有基于说话者的语音数据生成个人声学模型(individual acoustic model)并且通过使用个人声学模型进行语音识别的优点的语音识别装置和语音识别方法。除了前述目的以外,本公开的实施方式可被用于实现未详细描述的其他目的。

根据本公开的实施方式的语音识别装置包括:收集器,从基于语音的装置收集第一说话者(first speaker)的语音数据;第一存储器,累积第一说话者的语音数据;学习器(learner),学习累积在第一存储器中的第一说话者的语音数据并且基于所学习的语音数据生成第一说话者的个人声学模型;第二存储器,存储通用声学模型(generic acousticmodel)和第一说话者的个人声学模型;特征向量提取器,当从第一说话者接收到语音识别请求时,该特征向量提取器从第一说话者的语音数据提取特征向量;以及语音识别器,该语音识别器基于第一说话者的语音数据的累积量来选择通用声学模型和第一说话者的个人声学模型中的任一个并且语音识别器使用所提取的特征向量和所选择的声学模型识别语音命令。

语音识别装置可以进一步包括检测并且去除第一说话者的语音数据中的噪声的预处理器。

当第一说话者的语音数据的累积量大于或等于预定阈值时,语音识别器可以选择第一说话者的个人声学模型;并且当第一说话者的语音数据的累积量小于预定阈值时,语音识别器可以选择通用声学模型。

收集器可以收集包括第一说话者的多个说话者的语音数据,并且第一存储器可以累积多个说话者的各个说话者的语音数据。

学习器可以学习多个说话者的语音数据并且基于所学习的多个说话者的语音数据生成用于各个说话者的个人声学模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于现代自动车株式会社,未经现代自动车株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510601128.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top