[发明专利]声音识别装置以及用于执行声音识别的方法有效

申请号：	200910007438.1	申请日：	2009-02-13
公开（公告）号：	CN101510425A	公开（公告）日：	2009-08-19
发明（设计）人：	杉山博史;铃木薰;山本大介;古贺敏之	申请（专利权）人：	株式会社东芝
主分类号：	G10L15/26	分类号：	G10L15/26
代理公司：	中国国际贸易促进委员会专利商标事务所	代理人：	屠长存
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音识别装置以及用于执行方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

相关申请的交叉参考

本申请涉及包含在2008年2月15日提交的日本专利申请申请第 2008-035126号中的主题，其全部内容通过引用结合于此作为参考。

技术领域

本申请涉及声音识别装置，以及用于执行声音识别的方法。

背景技术

通常，已经知道一种与用户执行声音交互的机器人，其被称作声音交互机器人。然而，在一些情况下由于从诸如家庭或办公室的实际环境中的各种设备输出的噪声，声音交互机器人可能不能正确地识别由用户发出的声音。为了提高在由家庭电器或用户的动作发出噪声的环境中的声音识别率，优选地由用户以适当的强度将声音输入到传声器中。

已经提出了一种用于通过在检测到用户声音时计算S/N比并在 S/N比低于给定值时将机器人移向用户来改进S/N比的方法。这样的方法的示例在JP-A-2006-181651(同族美国公开是：US 2006/0143017A1)中被公开。然而，根据该方法，其没有确定机器人为了接收满足足以进行声音识别的S/N比的声音而需要向用户移近多少。此外，当周围噪声强度改变时，需要接收来自用户的另一声音来确定至用户的距离是否恰当。

已经提出了一种用于向用户指示实际声音强度和根据周围噪声强度的相对期望声音强度以使用户直觉地知道期望的声音音量的方法。该方法的示例在JP-A-2006-227499中被公开。然而，用户发出的大量声音是通过用户的头盖(brainpan)被用户听到的。因此，用户难以根据机器人发出的指示来调节声音的音量。同样，当周围噪声强度变化时，需要用户再次发出声音以接收适当强度范围内的声音。

上述传统方法采用了通过由用户发出的多个声音来调节用户的声音强度的方法。因此，这些方法需要用户每次在由于环境变化(诸如周围噪声强度的变化)而需要调节的时候再次发出声音。

发明内容

根据本发明的一个方面，提供了一种语音识别装置，包括：音频输入模块，其接收音频输入，并输出音频信号，该音频输入模块具有被配置为可调节的增益；语音识别模块，在音频信号中检测发现用户的语音出现的语音区间，并对该语音区间期间的音频信号执行语音识别；第一强度测量模块，测量语音区间中的音频信号的信号强度并将测量的信号强度作为语音强度输出；第二强度测量模块，测量噪声区间中的音频信号的信号强度并将测量的信号强度作为噪声强度输出，其中噪声区间是语音区间之外的时间区间；第一计算模块，计算作为语音强度与噪声强度之比的S/N比；距离测量模块，测量用户和语音输入模块之间的当前距离；第一存储模块，存储对应于语音识别模块能够执行具有给定识别率的语音识别的S/N比的第一阈值；第二存储模块，存储具有语音强度、当前距离以及增益的集合的语音特性，通过该语音特性，语音识别模块成功执行语音识别；第二计算模块，基于语音特性计算用于当前距离的推荐距离范围，在该推荐距离范围内，估算出S/N比超过第一阈值；以及显示模块，显示推荐距离范围和当前距离。

根据本发明的另一方面，提供了一种执行语音识别的方法，该方法包括：接收音频输入以输出具有被配置为可调节的增益的音频信号；在音频信号中检测发现出现用户的语音的语音区间以对该语音区间期间的音频信号执行语音识别；测量语音区间中的音频信号的信号强度以将测量的信号强度作为语音强度输出；测量噪声区间中的音频信号的信号强度，以将所测量的信号强度作为噪声强度输出，该噪声区间是语音区间之外的时间区间；计算作为语音强度与噪声强度之比的S/N比；测量距离用户的当前距离；存储对应于语音识别模块能够执行语音识别以具有给定识别率的S/N比的第一阈值；存储具有语音强度、当前距离以及增益的集合的语音特性，通过该语音特性，已经成功执行语音识别；基于语音特性计算用于当前距离的推荐距离范围，在该推荐距离范围内，估算出S/N比超过第一阈值；以及显示该推荐距离范围和当前距离。

附图说明

将参考附图描述实施本发明的各种特征的一般配置。提供的附图及其相关描述是为了示出本发明的实施例，而不用于限制本发明的范围。

图1是示出了根据本发明的第一实施例的声音交互机器人的外观的示意图。

图2是示出了根据第一实施例的声音交互机器人的使用的示例的示意图。

图3是根据第一实施例的声音交互机器人的功能框图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社东芝，未经株式会社东芝许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910007438.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音识别装置以及用于执行声音识别的方法有效

专利文献下载