[发明专利]具有多个同时语音识别器的系统有效
申请号: | 201480043399.X | 申请日: | 2014-07-30 |
公开(公告)号: | CN105493179B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | C·克莱因;D·穆尼二世;T·索米欧;L·宋;J·惠勒 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/22;G10L15/30;G06F3/16;G06F3/01 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 同时 语音 识别 系统 | ||
语音识别系统解释说出的系统命令以及应用命令两者。用户可以向计算设备的开放式话筒说出可由同时操作的至少两个语音识别器解释的命令。第一语音识别器解释操作系统命令,而第二语音识别器解释应用命令。系统命令可至少包括打开和关闭应用,而应用命令可至少包括游戏命令或菜单内导航。可使用保留词来标识命令是针对操作系统还是应用的。用户的节奏也可指示语音是全局命令还是应用命令。语音识别器可包括位于远程计算设备中(诸如在所谓的云中)的自然语言软件组件。
背景
包括一个或多个计算设备的系统可理解用户语音,用户语音可包括用以执行特定计算任务的指令。计算设备中所包括的话筒可接收用户语音并且可由多个用户访问。
一些系统依靠按键通话按钮来发起对用户语音的解释。另一些系统只可识别关于系统的特定指令,而其它系统只可识别涉及特定应用的指令。
概述
本技术包括解释诸如操作系统命令等全局命令以及针对一个或多个应用的由一个或多个用户对开放式话筒说出的命令的启用语音的系统。在该系统中,用户能够容易地在任何时间对焦点应用或操作系统说话,而不管操作系统的状态或者哪一个应用在前台。
两个语音识别器可以在系统中同时操作以支持对操作系统命令和应用命令的解释。这两个语音识别器可被存储在第一处理器可读存储器中并且由处理器在计算设备上同时执行。或者,第一语音识别器可被存储在第一处理器可读存储器中且由第一处理器在第一计算设备上执行,而第二语音识别器可被存储在第二处理器可读存储器中且由第二处理器在远程(诸如在云或因特网中)的第二计算设备上执行。在一实施例中,第二语音识别器包括用以解释来自用户的自然语言或语音的自然语言软件组件。
在各实施例中,操作系统命令至少包括:1)启动或关闭应用;2)多任务命令,诸如在正在运行的应用之间切换;3)社交命令,诸如评级、共享、邀请等;4)在处于焦点的当前应用内或者跨整个系统搜索;5)控制应用设置;6)控制系统设置;7)操纵后台任务的命令,诸如暂停后台音乐或控制语音呼叫或者播放与处于焦点的主应用同时运行的语音聊天。
除了操作系统命令之外,用户还可说出涉及焦点应用的命令。可用的局部或应用命令的集合取决于焦点应用且由应用预定。例如,交互式电子游戏应用中的应用命令可包括玩游戏动作或者游戏菜单系统内的导航。类似地,媒体应用中的命令可包括走带控制(例如,快进)或者用于浏览应用的可用内容的命令。
在各实施例中,操作系统和应用两者都可使用不受限的语音语法并且可随时间修改并改进这些语法。在各实施例中,语音命令被假定为涉及焦点应用,且系统保留的词或词组可被用来标识之后的操作系统命令。或者,用户的串连或更改的节奏也可被用来标识操作系统命令和/或应用命令。例如,说出的保留词以及一个和或多个操作系统命令后的长暂停指示用户已完成说出操作系统命令,并且系统可以默认返回到假定下一语音命令是应用命令(除非另一保留词被说出)。在一实施例中,串连允许使用单个保留词。在一替代实施例中,系统可默认接受操作系统命令。
在一实施例中,包括诸如数字电子智能代理等智能代理以使得用户可具有多轮对话或谈话。操作系统保留词或词组可以是代理的名称,或另选地可使用词组,诸如“show methe shortcuts(向我显示快捷方式)”或“system(系统)”。操作系统语音识别器与同一个或多个应用相关联的一个或多个应用语音识别器并行地持续监听保留词或词组。一旦用户已经针对操作系统,一个或多个应用就不再接收语音输入,直到用户与智能代理(或操作系统)的对话完成。结果,与智能代理的交互可涉及多轮谈话。
一旦交互完成-因为用户明确解散智能代理、因为谈话自然地完成(即,执行所请求的命令无需来自用户的附加信息)、或者由于非活动超时-输入焦点就自动返回到焦点应用。
操作计算设备的方法实施例包括由第一语音识别器接收表示来自话筒的全局命令的信息。表示来自话筒的应用命令的信息可由第二语音识别器接收。第二语音识别器与第一语音识别器同时操作。计算设备响应于表示全局命令的信息和表示应用命令的信息之一来执行计算操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480043399.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:选换挡轻便灵活的汽车变速器
- 下一篇:打击、吹奏和拍击乐器以及乐器布置