[发明专利]声音识别装置以及用于执行声音识别的方法有效
申请号: | 200910007438.1 | 申请日: | 2009-02-13 |
公开(公告)号: | CN101510425A | 公开(公告)日: | 2009-08-19 |
发明(设计)人: | 杉山博史;铃木薰;山本大介;古贺敏之 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 屠长存 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 装置 以及 用于 执行 方法 | ||
相关申请的交叉参考
本申请涉及包含在2008年2月15日提交的日本专利申请申请第 2008-035126号中的主题,其全部内容通过引用结合于此作为参考。
技术领域
本申请涉及声音识别装置,以及用于执行声音识别的方法。
背景技术
通常,已经知道一种与用户执行声音交互的机器人,其被称作声 音交互机器人。然而,在一些情况下由于从诸如家庭或办公室的实际 环境中的各种设备输出的噪声,声音交互机器人可能不能正确地识别 由用户发出的声音。为了提高在由家庭电器或用户的动作发出噪声的 环境中的声音识别率,优选地由用户以适当的强度将声音输入到传声 器中。
已经提出了一种用于通过在检测到用户声音时计算S/N比并在 S/N比低于给定值时将机器人移向用户来改进S/N比的方法。这样的 方法的示例在JP-A-2006-181651(同族美国公开是:US 2006/0143017A1)中被公开。然而,根据该方法,其没有确定机器 人为了接收满足足以进行声音识别的S/N比的声音而需要向用户移近 多少。此外,当周围噪声强度改变时,需要接收来自用户的另一声音 来确定至用户的距离是否恰当。
已经提出了一种用于向用户指示实际声音强度和根据周围噪声强 度的相对期望声音强度以使用户直觉地知道期望的声音音量的方法。 该方法的示例在JP-A-2006-227499中被公开。然而,用户发出的大 量声音是通过用户的头盖(brainpan)被用户听到的。因此,用户难 以根据机器人发出的指示来调节声音的音量。同样,当周围噪声强度 变化时,需要用户再次发出声音以接收适当强度范围内的声音。
上述传统方法采用了通过由用户发出的多个声音来调节用户的声 音强度的方法。因此,这些方法需要用户每次在由于环境变化(诸如 周围噪声强度的变化)而需要调节的时候再次发出声音。
发明内容
根据本发明的一个方面,提供了一种语音识别装置,包括:音频 输入模块,其接收音频输入,并输出音频信号,该音频输入模块具有 被配置为可调节的增益;语音识别模块,在音频信号中检测发现用户 的语音出现的语音区间,并对该语音区间期间的音频信号执行语音识 别;第一强度测量模块,测量语音区间中的音频信号的信号强度并将 测量的信号强度作为语音强度输出;第二强度测量模块,测量噪声区 间中的音频信号的信号强度并将测量的信号强度作为噪声强度输出, 其中噪声区间是语音区间之外的时间区间;第一计算模块,计算作为 语音强度与噪声强度之比的S/N比;距离测量模块,测量用户和语音 输入模块之间的当前距离;第一存储模块,存储对应于语音识别模块 能够执行具有给定识别率的语音识别的S/N比的第一阈值;第二存储 模块,存储具有语音强度、当前距离以及增益的集合的语音特性,通 过该语音特性,语音识别模块成功执行语音识别;第二计算模块,基 于语音特性计算用于当前距离的推荐距离范围,在该推荐距离范围 内,估算出S/N比超过第一阈值;以及显示模块,显示推荐距离范围 和当前距离。
根据本发明的另一方面,提供了一种执行语音识别的方法,该方 法包括:接收音频输入以输出具有被配置为可调节的增益的音频信 号;在音频信号中检测发现出现用户的语音的语音区间以对该语音区 间期间的音频信号执行语音识别;测量语音区间中的音频信号的信号 强度以将测量的信号强度作为语音强度输出;测量噪声区间中的音频 信号的信号强度,以将所测量的信号强度作为噪声强度输出,该噪声 区间是语音区间之外的时间区间;计算作为语音强度与噪声强度之比 的S/N比;测量距离用户的当前距离;存储对应于语音识别模块能够 执行语音识别以具有给定识别率的S/N比的第一阈值;存储具有语音 强度、当前距离以及增益的集合的语音特性,通过该语音特性,已经 成功执行语音识别;基于语音特性计算用于当前距离的推荐距离范 围,在该推荐距离范围内,估算出S/N比超过第一阈值;以及显示该 推荐距离范围和当前距离。
附图说明
将参考附图描述实施本发明的各种特征的一般配置。提供的附图 及其相关描述是为了示出本发明的实施例,而不用于限制本发明的范 围。
图1是示出了根据本发明的第一实施例的声音交互机器人的外观 的示意图。
图2是示出了根据第一实施例的声音交互机器人的使用的示例的 示意图。
图3是根据第一实施例的声音交互机器人的功能框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910007438.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:盘装置
- 下一篇:可移去的首字母标识片