[发明专利]声音识别装置以及用于执行声音识别的方法有效

专利信息
申请号: 200910007438.1 申请日: 2009-02-13
公开(公告)号: CN101510425A 公开(公告)日: 2009-08-19
发明(设计)人: 杉山博史;铃木薰;山本大介;古贺敏之 申请(专利权)人: 株式会社东芝
主分类号: G10L15/26 分类号: G10L15/26
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 屠长存
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 声音 识别 装置 以及 用于 执行 方法
【说明书】:

相关申请的交叉参考

本申请涉及包含在2008年2月15日提交的日本专利申请申请第 2008-035126号中的主题,其全部内容通过引用结合于此作为参考。

技术领域

本申请涉及声音识别装置,以及用于执行声音识别的方法。

背景技术

通常,已经知道一种与用户执行声音交互的机器人,其被称作声 音交互机器人。然而,在一些情况下由于从诸如家庭或办公室的实际 环境中的各种设备输出的噪声,声音交互机器人可能不能正确地识别 由用户发出的声音。为了提高在由家庭电器或用户的动作发出噪声的 环境中的声音识别率,优选地由用户以适当的强度将声音输入到传声 器中。

已经提出了一种用于通过在检测到用户声音时计算S/N比并在 S/N比低于给定值时将机器人移向用户来改进S/N比的方法。这样的 方法的示例在JP-A-2006-181651(同族美国公开是:US 2006/0143017A1)中被公开。然而,根据该方法,其没有确定机器 人为了接收满足足以进行声音识别的S/N比的声音而需要向用户移近 多少。此外,当周围噪声强度改变时,需要接收来自用户的另一声音 来确定至用户的距离是否恰当。

已经提出了一种用于向用户指示实际声音强度和根据周围噪声强 度的相对期望声音强度以使用户直觉地知道期望的声音音量的方法。 该方法的示例在JP-A-2006-227499中被公开。然而,用户发出的大 量声音是通过用户的头盖(brainpan)被用户听到的。因此,用户难 以根据机器人发出的指示来调节声音的音量。同样,当周围噪声强度 变化时,需要用户再次发出声音以接收适当强度范围内的声音。

上述传统方法采用了通过由用户发出的多个声音来调节用户的声 音强度的方法。因此,这些方法需要用户每次在由于环境变化(诸如 周围噪声强度的变化)而需要调节的时候再次发出声音。

发明内容

根据本发明的一个方面,提供了一种语音识别装置,包括:音频 输入模块,其接收音频输入,并输出音频信号,该音频输入模块具有 被配置为可调节的增益;语音识别模块,在音频信号中检测发现用户 的语音出现的语音区间,并对该语音区间期间的音频信号执行语音识 别;第一强度测量模块,测量语音区间中的音频信号的信号强度并将 测量的信号强度作为语音强度输出;第二强度测量模块,测量噪声区 间中的音频信号的信号强度并将测量的信号强度作为噪声强度输出, 其中噪声区间是语音区间之外的时间区间;第一计算模块,计算作为 语音强度与噪声强度之比的S/N比;距离测量模块,测量用户和语音 输入模块之间的当前距离;第一存储模块,存储对应于语音识别模块 能够执行具有给定识别率的语音识别的S/N比的第一阈值;第二存储 模块,存储具有语音强度、当前距离以及增益的集合的语音特性,通 过该语音特性,语音识别模块成功执行语音识别;第二计算模块,基 于语音特性计算用于当前距离的推荐距离范围,在该推荐距离范围 内,估算出S/N比超过第一阈值;以及显示模块,显示推荐距离范围 和当前距离。

根据本发明的另一方面,提供了一种执行语音识别的方法,该方 法包括:接收音频输入以输出具有被配置为可调节的增益的音频信 号;在音频信号中检测发现出现用户的语音的语音区间以对该语音区 间期间的音频信号执行语音识别;测量语音区间中的音频信号的信号 强度以将测量的信号强度作为语音强度输出;测量噪声区间中的音频 信号的信号强度,以将所测量的信号强度作为噪声强度输出,该噪声 区间是语音区间之外的时间区间;计算作为语音强度与噪声强度之比 的S/N比;测量距离用户的当前距离;存储对应于语音识别模块能够 执行语音识别以具有给定识别率的S/N比的第一阈值;存储具有语音 强度、当前距离以及增益的集合的语音特性,通过该语音特性,已经 成功执行语音识别;基于语音特性计算用于当前距离的推荐距离范 围,在该推荐距离范围内,估算出S/N比超过第一阈值;以及显示该 推荐距离范围和当前距离。

附图说明

将参考附图描述实施本发明的各种特征的一般配置。提供的附图 及其相关描述是为了示出本发明的实施例,而不用于限制本发明的范 围。

图1是示出了根据本发明的第一实施例的声音交互机器人的外观 的示意图。

图2是示出了根据第一实施例的声音交互机器人的使用的示例的 示意图。

图3是根据第一实施例的声音交互机器人的功能框图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910007438.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top