[发明专利]机动车中的语音识别有效
申请号: | 201380053806.0 | 申请日: | 2013-05-18 |
公开(公告)号: | CN104737226B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | G·格吕沙尔斯基;T·坎切瓦 | 申请(专利权)人: | 奥迪股份公司;大众股份公司 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G01C21/36;G10L15/30;B60R16/037;G10L15/22 |
代理公司: | 北京市中咨律师事务所11247 | 代理人: | 刘丹,吴鹏 |
地址: | 德国因戈*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机动车 中的 语音 识别 | ||
本发明涉及一种用于在机动车中进行语音识别的方法。借助于车辆内部的语音识别器——该语音识别器在此被称为车载-语音识别器,基于用户的语音输入由语音输入来获得语言文本。本发明还涉及一种用于实施本发明方法的机动车信息娱乐系统,以及具有用于实施本发明方法的处理装置的机动车。
当今车辆中的信息-娱乐系统使用自动语音识别系统或ASR(Automatic Speech Recognition),以便接收来自驾驶员的语音输入。这些ASR可以要么在车辆本身(车载-onboard)中,要么在远程服务器(online)上。为此,识别装置可以被配备用于执行不同数量的任务。
在EP 1 408 304 A1中介绍了一种用于机动车的控制系统,该控制系统可以实现机动车的设备的语音控制。车辆外部的语音识别器(结合本发明这被称为非车载-语音识别器)被用于识别单个语音输入,也就是说将其转换成机器可处理的语言文本。为此在现有技术中已经公知,检测语音声音作为语音信号,然后将所述语音声音数字化,并且借助于特征提取为语音识别做准备。接下来将所提取到的特征通过移动通信传递给非车载-语音识别器,然后该非车载-语音识别器将其识别结果再次通过移动通信提供给机动车。这种解决方案的缺点是,必须有移动通信连接可供使用,语音识别才能正常工作。
在EP 1 341 363 B1中介绍了一种驾驶员信息系统,该驾驶员信息系统同样使用了非车载-语音识别器。附加地,非车载-语音识别器可以被用于简单的识别任务,例如识别个别控制命令。在这种情况下,决策单元根据需要在车载-语音识别器和非车载-语音识别器之间进行转换,以便将用户的单个语音输入转化成语言文本。非车载-语音识别器在此仅被设计用于在语音对话范围内进行识别。反之,车载-语音识别器仅理解单个的指令词。语音对话系统的优点是,如果他还未明白特定的语言输入,语音识别器可以提出疑问。然而,这种情况下的缺点是,在驾驶期间使用语音识别系统时会导致驾驶员分心。
本发明的目的是:在机动车中提供可靠的语音识别,其使得机动车中的用户尽可能少地从交通现状中分心。
该目的通过根据权利要求1所述的方法、根据权利要求12所述的信息娱乐系统和根据权利要求13所述的机动车来实现。本发明的有利的改进方案由从属权利要求给出。
根据本发明的方法确保:在不向用户提出询问的情况下将语音输入传输给一自动的语音识别系统以生成语言文本。在对特定的语音输入进行语音识别有困难时,它以有利的方式防止了用户从交通现状中分心。根据本发明的方法在此通过车载的处理装置来实施,该处理装置从车辆内部的检测装置——例如带有联接在下游的信号处理装置的麦克风——处接收用户的语音输入。至少一个所接收的语音输入在此被处理装置传输给车辆内部的车载-语音识别器。然后,处理装置从该车载-语音识别器接收第一识别结果、即例如可能的语言文本候选对象亦或多个可能的语言文本候选对象的列表。“语言文本候选对象”是将语音输入转换为了字符串的文本。如果发出的语音输入为“Hallo”,那么正确的语言文本候选对象是字符串“Hallo”。代替于纯文本“Hallo”,也可以以符号的形式表示为语言文本候选对象的语音识别结果或者表示为对可能的语言文本候选对象的列表的列表项的参考或者表示为列表项的标识符(例如ID_0815)。
这时希望降低基于第一识别结果进行错误识别的可能性,即降低输出不正确的语言文本的可能性,这将使用户不必分心。为此,通过处理装置将语音输入全部或部分地传输给车辆外部的非车载-语音识别器。然后由处理装置从该非车载-语音识别器接收第二识别结果、即语言文本候选对象或者由多个语言文本候选对象组成的列表。然后,不仅根据第一识别结果而且根据第二识别结果通过处理装置来确定最终作为识别结果而被输出的语言文本。
根据本发明的方法具有以下优点:语音输入被全部或部分地传输给一种双重的语音识别系统,即,一重为传输给车辆内的语音识别装置,另一重为传输给车辆外的语音识别装置。于是,最终作为识别结果而被输出的语言文本更可能符合用户实际说的话。结合本发明,语音输入要么可以理解为经变换的声信号、即模拟信号,要么可以理解为数字信号,或者也可以理解为通过对语音信号进行已知的特征提取而形成的、各信号段的特征的序列、即例如美尔倒谱系数的序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥迪股份公司;大众股份公司,未经奥迪股份公司;大众股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380053806.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:导电聚合物组合物与膜
- 下一篇:数据处理装置以及相关数据处理方法