[发明专利]声音识别装置有效
申请号: | 200980129204.2 | 申请日: | 2009-04-23 |
公开(公告)号: | CN102105929A | 公开(公告)日: | 2011-06-22 |
发明(设计)人: | 井上让;竹里尚嘉;古本友纪 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F3/16;G10L15/08;G10L15/28 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 侯颖媖;胡烨 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 装置 | ||
技术领域
本发明涉及一种利用声音来操作例如导航装置等设备的声音识别装置,特别涉及一种利用声音操作来进行与手动操作相同的步序的技术。
背景技术
在利用声音对设备进行操作的情况下,若用户的发音模糊,则无法唯一决定操作内容。为了解决该问题,以往一般使用如下方法:由设备呈现作为声音识别结果的候选项,用户从该候选中选择并确定正确的候选。然而,存在如下问题:该方法中要转移至手动操作中不存在的声音操作所特有的画面,因此用户难以获知操作的步序。
为了解决这种因发音的模糊性而引起的问题,专利文献1披露了如下的信息输入输出装置:用户可利用声音对解释结果进行修正,用户还可利用声音对解释结果的候选进行选择。该信息输入输出装置中,输入解释候选暂定输出部生成用于使用户从由输入装置得到的各解释候选中选择候选的暂定呈现信息。定时器部随着暂定呈现信息的输出而开始计时动作,在经过预定时间后产生定时器信号。解释信息选择·确定部在从声音识别装置输入用于选择候选的声音信息时,或者在从定时器部产生定时器信号时,从各解释候选中选择一个候选,提供给信息处理装置以作为解释信息。输出合并部对来自信息处理装置的输出信息和来自输入解释候选集合暂定输出部的暂定呈现信息进行合并,将其提供给输出装置以作为对用户的输出信息。
专利文献1:日本专利特开平10-91309号公报
然而,在上述的专利文献1所披露的技术中,存在如下问题:由于不知道正确的声音命令,因此用户的发音内容变得模糊,用户难以利用声音对其进行修正。
发明内容
本发明是为了解决上述问题而完成的,其课题在于提供一种能以相同的步序进行手动操作和声音操作的声音识别装置。
为了解决上述问题,本发明所涉及的声音识别装置包括:声音输入装置,该声音输入装置输入所发出的按钮名称的声音并将其转换成电信号;声音识别处理部,该声音识别处理部根据从声音输入装置作为电信号发送来的声音信号来执行声音识别处理;候选按钮检测部,该候选按钮检测部对具有与由声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮;显示控制部,该显示控制部在由候选按钮检测部检测出多个候选按钮的情况下,生成表示如下状态的画面,该状态为选择该多个候选按钮中的至少一个按钮;及显示装置,该显示装置显示由显示控制部生成的画面。
根据本发明所涉及的声音识别装置,由于采用如下结构:对具有与声音识别的结果有部分一致的按钮名称的按钮进行检测以作为候选按钮,在检测出多个候选按钮的情况下,在画面上显示选择该多个候选按钮中的至少一个按钮的状态且用户可按下按钮,因此即使用户的发音模糊,也能以与手动操作相同的步序进行声音操作。
附图说明
图1是表示本发明的实施方式1所涉及的声音识别装置的结构的方框图。
图2是以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中心、来表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。
图3是用于说明本发明的实施方式1所涉及的声音识别装置中检测出一个候选按钮的情况下的动作的图。
图4是用于说明本发明的实施方式1所涉及的声音识别装置中检测出多个候选按钮的情况下的动作的图。
图5是以操作未完成时从追加操作开始直到操作完成为止的声音操作处理为中心、来表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。
图6是以操作未完成时发出按钮名称以外的声音而使操作完成的声音操作处理为中心、来表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。
图7是表示本发明的实施方式2所涉及的声音识别装置的结构的方框图。
图8是以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中心、来表示本发明的实施方式2所涉及的声音识别装置的动作的流程图。
具体实施方式
下面,为了更详细地说明本发明,根据附图对用于实施本发明的方式进行说明。
实施方式1.
图1是表示本发明的实施方式1所涉及的声音识别装置的结构的方框图。该声音识别装置包括声音输入装置11、声音识别处理部12、候选按钮检测部13、手动操作装置14、显示控制部15、显示装置16、各种功能执行部17、响应声音生成部18及声音输出装置19。
声音输入装置11例如由话筒构成,将用户发出的声音转换成电信号,作为声音信号发送到声音识别处理部12。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980129204.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分体节叉式十字轴万向节
- 下一篇:自动滴液调节控制器