[发明专利]用于多模式输入的同步和消歧的系统和方法有效
申请号: | 201080021524.9 | 申请日: | 2010-02-05 |
公开(公告)号: | CN102428440A | 公开(公告)日: | 2012-04-25 |
发明(设计)人: | 翁富良;任骝;Z·冯;邹林灿;B·阎;沈中南 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/22;G06F3/038 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 德国斯*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 模式 输入 同步 系统 方法 | ||
1.一种对话系统中的计算机实施方法,包括:
从多种输入模式接收输入;
基于与所述输入相关的事件的时间顺序同步所述输入;
针对事件的输入产生原始假设;
基于所述多个输入中的一个或者更多其他输入接收所述输入的约束;
将所述约束与所述原始假设结合;以及
导出新假设以解释所述输入。
2.根据权利要求1所述的方法,其中,所述假设包括假设值(H)和加权值(W),其中W表示所述输入的正确解释的可能性。
3.根据权利要求1所述的方法,其中,所述输入至少部分由人类用户提供,并且其中所述多种输入模式选自由以下各项组成的组:口头输入、手势输入、键盘输入、鼠标输入、以及笔或者指示笔输入。
4.根据权利要求3所述的方法,其中,所述输入至少部分由应用程序或者设备提供,并且其中所述多种输入模式还包括程序输入和设备输入。
5.根据权利要求1所述的方法,其中,所述输入包含一个或者更多错误,并且其中基于由所述约束提供的多模式信息使用所述新假设来对所述输入进行消歧。
6.根据权利要求5所述的方法,其中,所述对话系统包括语音识别级,所述语音识别级包含口语理解单元。
7.根据权利要求6所述的方法,其中,所述对话系统还包括手势识别单元,所述手势识别单元解释通过触摸屏接口所提供的或者由一个或者更多手势传感器所感测的物理用户输入。
8.一种对话系统,包括:
输入级,其从多种输入模式接收输入;
同步模块,其基于与所述输入相关的事件的时间顺序来同步所述输入;
对话管理器,其针对事件的输入产生原始假设;
消歧模块,其基于所述多个输入中的一个或者更多其他输入接收所述输入的约束,其中所述对话管理器将所述约束与所述原始假设结合并且导出新假设以解释所述输入。
9.根据权利要求8所述的系统,其中,所述假设包括假设值(H)和加权值(W),其中W表示所述输入的正确解释的可能性。
10.根据权利要求1所述的系统,其中,所述输入至少部分由人类用户提供,并且其中提供到所述输入级的所述多种输入模式选自由以下各项组成的组:口头输入、手势输入、键盘输入、鼠标输入、以及笔或者指示笔输入。
11.根据权利要求10所述的系统,其中,所述输入至少部分由应用程序或者设备提供,并且其中所述多种输入模式还包括程序输入和设备输入。
12.根据权利要求8所述的系统,其中,所述输入包含一个或者更多错误,并且其中基于由所述约束提供的多模式信息使用所述新假设来对所述输入进行消歧。
13.根据权利要求12所述的系统,其中,所述对话系统包括语音识别级,所述语音识别级包含口语理解单元。
14.根据权利要求13所述的系统,其中,所述对话系统还包括手势识别单元,所述手势识别单元用于解释通过触摸屏接口所提供的或者由一个或者更多手势传感器所感测的物理用户输入。
15.根据权利要求14所述的系统,其中,所述消歧模块包括在所述手势识别单元和所述语音识别级中的每一个中提供的消歧部件
16.根据权利要求15所述的系统,还包括:
响应发生器,其基于所述用户输入产生系统输出;
文本-语音单元,其将至少一部分所述系统输出转换为口语输出;
耦合到文本-语音单元的音频输出设备,其为所述用户播放所述口语输出;以及
图形输出,其通过图形用户接口处理显示来自所述响应发生器的图形输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080021524.9/1.html,转载请声明来源钻瓜专利网。