[发明专利]用于激活和/或进行语音对话的装置、系统和方法有效

专利信息
申请号: 201010527304.5 申请日: 2010-10-29
公开(公告)号: CN102054481A 公开(公告)日: 2011-05-11
发明(设计)人: 哈尔罗·赫普肯;卡尔-海因茨·克诺布尔;戴维·肯普夫;汉斯-威廉·吕尔 申请(专利权)人: 大陆汽车有限责任公司
主分类号: G10L17/00 分类号: G10L17/00;G10L15/06;G10L15/02;G10L21/02;H04M9/08
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 吴孟秋;李慧
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 激活 进行 语音 对话 装置 系统 方法
【说明书】:

技术领域

发明涉及用于激活语音对话和/或进行语音对话的一种装置、一种系统和一种方法。 

背景技术

语音对话系统用于电子仪器、例如车辆电脑,而不需要对触觉的操作运行进行控制。根据现有技术已知,用于进行语音对话或用于激活语音对话的装置根据指令搜索通过噪声抑制或回波补偿而变得清晰的语音信号。在用于激活语音对话的装置中,根据确定的关键词进行搜索,该关键词用于激活语音对话。在用于进行语音对话的装置中,检查该语音信号是否包含作为指令而存储在集成于语音对话系统中的指令数据库中的单词。如果识别出指令,那么执行属于该命令的行为。 

尤其在干扰噪声作用于系统的应用条件下,这样的用于进行语音对话或用于激活语音对话的装置是不可靠的。这尤其在应用于轿车中时是不利的,因为在干扰影响下、例如乘客的谈话,根据现有技术的装置常常由于错误识别的命令而执行不期望的功能。 

发明内容

因此本发明的目的在于,特别抗干扰地进行语音对话和/或激活语音对话。 

该目的通过一种根据权利要求1所述的装置和一种根据权利要求19所述的方法实现。在从属权利要求中给出有利的改进方案。 

指令分析的可靠性通过如下方式显著提高,即该装置不仅包括用于确定语音信号中是否包含指令的语音识别单元和用于取决于在语音信号中识别的指令而产生输出信号的决策单元,还包括用于根据语音信号和至少一个存储的讲话者模型而识别讲话者的讲话者识别单元,其中这样设计决策单元,即取决于指令的结果行为的执行取决于,至少部分产生语音信号的讲话者是否被讲话者识别单元识别为相应于存储的讲话者模型的讲话者。 

语音识别单元可理解为一个设计用于鉴定来自语音信号的指令和/或指令结构的单元。也就是说,根据语音模型和根据存储的指令,分析语言信号中是否包含/包含哪些指令或指令结构。如果包含指令,那么它被识别为相应的有效指令。 

在这种情况下,指令不一定只是单个的词。在此更确切地说意味着语音输入的每种形式。例如,概念“指令”也意味着数列/号码序列、句子成分和/或完整的句子。 

讲话者识别单元可理解为可以特别设计用于从语音信号中提取讲话者特征并用于把该讲话者特征与之前存储在至少一个讲话者模型中的、取决于讲话者的特征相比较的单元,其中根据比较确定当前的讲话者和对应于讲话者模型的讲话者一致或不一致。有利地这样设计讲话者识别单元,即当语音信号完全来自对应于讲话者 模型的讲话者时,也就是说多人同时讲话而信号有利地不对应于任何讲话者时,才确定一致。 

待执行的结果行为可以是不同类型的结果行为。 

在用于激活语音对话的装置中,结果行为例如可以是双重事件的输出,这作为信息仅包括是否应该进行语言对话的激活的决定。可替换地,该事件可以包括关于引起激活的讲话者的信息,从而产生取决于讲话者的激活信号。 

在用于进行语音对话的装置中,作为结果行为的语音输出尤其重要。可以利用它将信息、例如其它选项通知给讲话者。例如如果讲话者要调用关于位于附近的餐馆的信息并使用了与之相应的指令,那么语音对话系统可以要求讲话者从多个可能的餐馆类型中作出选择。 

其它的可能的结果行为是控制车辆功能的控制事件。例如可以向用于座位加热的控制系统发送用于提高加热温度的事件。此外,可以输出用于调用位于车辆中的其它系统的信息的控制信号。此外结果行为还可能由控制事件和语音输出组成。本领域技术人员由根据现有技术的用于进行语音对话的装置还已知了其它的可能的输出信号。 

此外,本发明还涉及一种方法:其中首先接收语音信号;其中随后识别存在于语音信号中的指令或指令结构;并且其中根据语音信号和至少一个讲话者模型识别讲话者;其中在识别指令和讲话者之后,取决于讲话者和指令的识别的结果执行结果行为。 

这样有利地设计决策单元,即当由讲话者识别单元将包含指令的语音信号鉴定为来自授权的讲话者时,那么仅仅执行取决于指令 的结果行为。也就是说将讲话者识别单元和语音识别单元的结果与存储在使用者模型中的数据比较,并检查讲话者是否被授权。 

根据实施例,可以反馈缺乏授权的情况。这种反馈的优点在于,讲话者可以在未识别或识别之间区分作为未充分授权的讲话者。 

重要的是,通过由无资格的讲话者输入的指令不会触发对应于指令的待执行的结果行为,也就是说,来自无资格的讲话者的指令不会导致结果行为或导致与授权的讲话者不同的结果行为。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大陆汽车有限责任公司,未经大陆汽车有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010527304.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top