[发明专利]用于多模式输入的同步和消歧的系统和方法有效
申请号: | 201080021524.9 | 申请日: | 2010-02-05 |
公开(公告)号: | CN102428440A | 公开(公告)日: | 2012-04-25 |
发明(设计)人: | 翁富良;任骝;Z·冯;邹林灿;B·阎;沈中南 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/22;G06F3/038 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 德国斯*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 模式 输入 同步 系统 方法 | ||
技术领域
本发明的实施例总体上涉及对话系统,并且更具体地说涉及对提供到对话系统的用户输入的同步和消歧。
背景技术
对于人类来说,口语是最自然和最方便的沟通工具。语音识别技术上的进步已经允许各种不同机器和计算机系统的口语接口的增加的使用。各种系统和服务的接口通过语音命令给人们提供了便利和效率,但是只有当口语接口是可靠的才行。这一点对于眼睛忙碌和手忙碌情况下的应用来说尤为重要,例如开车或执行复杂的计算任务。使用口头命令和语音识别的人机接口一般是基于对话系统的。对话系统是被设计为在输入和输出通道上使用一致的结构和文本、语音、图形或其他沟通模式来与人交谈的计算机系统。利用语音的通话系统被称为口头对话系统,并且一般代表最自然的人机接口类型。随着对电子设备依赖的不断增大,口头对话系统被越来越多地实施在许多不同的系统中。
在许多人机交互(HMI)系统中,用户可以通过多种输入设备或多种类型的设备与系统交互,例如通过语音输入、手势控制和传统的键盘/鼠标/笔输入。这在数据输入方面为用户提供了灵活性,并且允许用户根据其自己的偏好更高效地向系统提供信息。
现有的HMI系统通常限制特定类型数据的特定输入模式,或者允许用户一次仅使用多种模式中的一种。例如,车辆导航系统可以包括触摸屏和用于口头命令的语音识别系统。然而,触摸屏通常仅限于允许用户通过接触来选择确定的菜单项,而不是通过语音命令。这样的多模式系统既不通过不同的输入模式来协同用户命令,也不利用一种模式的输入数据来通知和/或修改另一种模式的数据。因此,现有的多模式系统没有充分地提供无缝的用户接口系统,在所述用户接口系统中,来自所有可能输入模式的数据可以被用来向系统提供准确的信息。
因此,所期望的是用于人机交互系统的多模式信息用户输入接口,其能够同步和整合从不同模式获取的信息,在多模式输入信息的帮助下消除歧义和从错误中恢复。这样的系统会极大地提高用户满意度、系统性能和系统鲁棒性。
还期望的是能够同步和整合以任意顺序从不同模式获取的多模式信息的HMI用户输入系统。
附图说明
在附图中以示例而非限制的方式说明了本发明的实施例,在附图中,相同的附图标记指示相同的元件并且在附图中:
图1说明了根据实施例的实施了多模式同步和消歧系统的多模式人机系统。
图2是根据实施例的多模式用户交互系统的框图,该多模式用户交互系统接受用户的手势和语音作为输入,并且包括了多模式同步和消歧系统。
图3说明了根据实施例的使用多模式用户交互系统的输入事件的处理。
图4是根据实施例的实施多模式交互系统的口头对话管理器系统的框图。
图5是说明根据实施例的处理对话系统中通过多模式接口的用户输入的方法的流程图。
具体实施方式
描述了包括用于人机交互(HMI)系统的多模式同步和消歧系统的对话系统的实施例。实施例包括从多种不同的用户输入机制接收用户输入的部件。该多模式同步和消歧系统同步和整合从不同模式获取的信息,对输入进行消歧,并且从可能产生的关于任何用户输入的任何错误中恢复。这样的系统有效地解决了与用户输入相关的任何歧义并且校正人机交互中的错误。
在下面的描述中,介绍了许多具体的细节,以提供对多模式同步和消歧系统和方法的实施例的透彻理解和使其能够实现的描述。然而,相关领域的技术人员将会认识到可以在没有这些具体细节中的一个或多个的情况下实施这些实施例,或者可以用其他部件、系统等来实施这些实施例。在其他实例中,没示出公知的结构或操作,或者没有详细地描述,以避免混淆所公开的实施例的方面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080021524.9/2.html,转载请声明来源钻瓜专利网。