[发明专利]用于识别语音的系统和方法有效
申请号: | 201480033420.8 | 申请日: | 2014-05-19 |
公开(公告)号: | CN105283914B | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | B·哈尔沙姆;J·R·赫尔歇 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/22;G10L15/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 组分数 方法识别 声学模型 语言模型 词序列 响应 更新 | ||
一种系统和方法识别包括词的序列的语音。利用声学模型和语言模型生成语音的一组解释,并且针对每一个解释,确定在表达所述词的序列时表示解释的正确性的分数,以生成一组分数。接下来,基于每一个解释与响应于接收到词序列约束而确定的约束的一致性来更新所述一组分数。
技术领域
本发明总体上涉及自动语音识别,并且更具体地,涉及在给予用户低认知负荷的同时提供语音识别。
背景技术
通常已知的是,由驾驶员执行的任何非驾驶相关任务都可能使注意力不集中于驾驶。因此,近期关注通过立法手段和通过驾驶员教育两者来减少驾驶时移动电话的使用。对于驾驶员在车辆中使用信息、通信以及娱乐功能来说,还存在日益增长的需求。
研究表明,与常规视觉或手动接口相比,基于语音的接口可以不太分散注意力。用于有限功能的基于命令的语音接口在车辆中正变得普遍。然而,因为识别大词汇量连续语音易于出错,所以针对像SMS这种功能使用语音的文本输入是困难的。由此,需要纠正或以其它方式改变已经利用语音输入的文本,同时减少正在驾驶的用户方面的分心。
用于纠正不受限制语音的一些方法利用编辑应用,即,具有计算机显示器和常规键盘的字处理机。例如,U.S.5,960,447中描述的方法通过以与关联语音来标记所识别文本中的词(word)并且允许字处理软件的用户收听用于编辑文本转录的语音,来纠正错误识别的语音。
U.S.5,970,460中描述的另一种方法通过在编辑应用程序中关联“语音事件数据库”和文本转录中的位置并且加宽上下文,来改进编辑操作。这种方法需要主要关注纠正任务,包括常规键盘、鼠标器以及菜单选择,并且具体来说,利用为关注视觉显示所需的视觉资源。然而,键盘、触摸屏以及大视觉显示器的使用未最小化从驾驶分心。
其它方法通过利用随后语音编辑由第一语音所产生的转录,来最小化交互作用的复杂性。例如,U.S.6,064,959中描述的方法利用随后说话来纠正语音识别的结果。类似的是,U.S.7,444,286中描述的方法选择语音识别中的要重新识别的部分。然而,该语音的随后解释可以产生错误,从而导致增加纠错工作,并且还导致驾驶员分心。
U.S.2006/293889中描述的另一方法使用纠正由用户给出的单个词,来调整针对与该单个词相邻的词的另选建议。然而,如果用户的语音中的多个词被不正确地解释,则该用户必须多次纠正该语音解释。而且,与更一般类型的交互作用相对比,这种方法的纠正限于替换所选择词,其可以导致用户的进一步分心。因此,需要将引导语音的解释所需的交互作用和用户注意力减到最小。
发明内容
本发明的一些实施方式基于以下认知,即,在对包括一系列词的大词汇量连续语音的语音识别中出现的错误通常与其它错误相关联。因此,对识别结果的纠正可以用于预测其它错误可能出现在哪里并且用于纠正附加错误,而不是只纠正初始错误并等待附加的用户输入。这些其它错误可在相邻的词位置出现,或者可能在无需对相邻的词进行任何改变的情况下在较远的位置出现,因此纠正应当用于更新识别结果。
例如,在导航关注点任务中的识别结果可能包括两个另选词序列“Museum ofFine Arts”和“Emporium of Fine Carts”。在这种情况下,如果原始解释是“Museum ofFine Arts”,并且用户将“Arts”改变成“Carts”,则很可能的是,词“Museum”应当改变成“Emporium”,即使其间存在解释未发生改变的几个词。
另外,本发明的一些实施方式基于以下总体认知,即,对大词汇量连续语音的语音识别的解释的纠正不需要被限制成将一个可能的词改变成另一个,而是还可以包括更一般种类的纠正约束。于是可将该纠正约束用于重新解释用户说出的言语。
与仅使用和单个词相对应的声学信号的解释相比,这种约束可以改进正确解释一组词的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480033420.8/2.html,转载请声明来源钻瓜专利网。