[发明专利]在自然语言语音服务环境中处理多模式装置交互的系统和方法有效
申请号: | 201080017511.4 | 申请日: | 2010-02-22 |
公开(公告)号: | CN102439659A | 公开(公告)日: | 2012-05-02 |
发明(设计)人: | L·贝尔德文;克里斯·魏德 | 申请(专利权)人: | 声钰科技 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 语音 服务 环境 处理 模式 装置 交互 系统 方法 | ||
相关申请的交叉引用
本申请要求2009年2月20日提交的名称为“SYSTEMAND METHOD FOR PROCESSING MULTI-MODAL DEVICE INTERACTIONS IN A NATURAL LANGUAGE VOICE SERVICES ENVIRONMENT”的第12/389,678号美国专利申请的权益,该美国专利申请的全部内容通过引用并入本文。
技术领域
本发明涉及用于处理与一个或多个装置和/或应用程序进行的多模式交互的综合自然语言语音服务环境,其中所述多模式交互可以提供用于配合解释和另外处理伴随所述多模式交互的自然语言语句的额外背景。
背景技术
近年来随着技术的进步,消费性电子装置已出现并几乎在很多人的日常生活中无处不在。为了满足移动电话、导航装置、嵌入式装置和其他这样的装置的功能性和移动性的增长引起的日益增长的需求,很多装置除了核心应用以外还提供大量特征和功能。然而,较大的功能性还带来了折衷,包括通常抑制用户完全利用他们的电子装置的所有性能的学习难度。例如,很多现有的电子装置包括复杂的人机界面,这些复杂的人机界面可能不是特别方便使用,这会抑制很多技术的大规模市场应用。而且,不方便的界面还经常导致难以找到或使用期望的特征(例如,因为菜单复杂或导航繁琐)。就这一点而言,很多用户趋向于不使用甚或不了解他们的装置的很多潜在性能。
就这一点而论,电子装置的增加的功能往往趋向于浪费,市场研究表明,很多用户仅使用给定装置上可用的特征或应用的一部分。而且,在无线联网和宽带接入越来越普遍的社会中,消费者往往自然地希望他们的电子装置具有无缝移动性能。因此,由于消费者对更简单的与电子装置交互的机制的需求加强,因此妨碍快速且集约化交互的不方便的界面成为重要的议题。但是,在很大程度上仍未满足对以直观方式使用技术的机制的日益增长的需求。
一种简化电子装置中的人机交互的方法包括使用语音识别软件,该语音识别软件有可能使用户利用原本不熟悉、不了解或难以使用的特征。例如,最近由Navteq公司(其提供比如自动导航和基于网页的应用的各种应用中使用的数据)进行的一项调查表明,语音识别在电子装置消费者最期望的特征中占首位。虽然如此,就用户而言,现有的语音用户界面在实际工作时仍需要大量学习。
例如,很多现有的语音用户界面仅支持根据特定的命令与控制序列或语法制定的请求。而且,很多现有的语音用户界面因不准确的语音识别而导致用户沮丧或不满。类似地,通过强迫用户提供预先建立的命令或关键字来以系统可以理解的方式传递请求,现有的语音用户界面未能有效地使用户加入富有成效的、配合的对话中以解析请求并促进对话朝着令人满意的目标进行(例如,当用户可能不确定具体需求、可用信息、装置性能等时)。就这一点而言,现有的语音用户界面往往有各种缺点,包括大大限制了使用户以配合方式和对话方式加入对话。
此外,很多现有的语音用户界面达不到利用分布在不同领域、装置和应用程序中的信息以解析基于自然语言语音的输入。因此,现有的语音用户界面的缺陷在于局限于已经设计出的有限的一组应用程序或者局限于存在有它们的装置。尽管技术进步已使得用户通常利用若干装置来满足他们的各种需求,但现有的语音用户界面并不足以使用户摆脱装置的限制。例如,用户可能对与不同应用程序和装置关联的服务感兴趣,但现有的语音用户界面往往限制用户利用他们认为合适的应用程序和装置。而且,实际上,用户在任一给定时间通常仅能够携带有限数量的装置,而在各种情况下可能需要与用户目前使用的其他装置有关的内容或服务。
因此,尽管用户往往具有不同的需求,其中在各种背景或环境中可能想要与不同的装置关联的内容或服务,但现有的语音技术往往达不到提供这样的综合环境:在该综合环境中,用户可以请求与几乎任何装置或网络关联的内容或服务。就这一点而言,现有的语音服务环境中对信息可用性和装置交互机制的限制往往妨碍用户以直观、自然且有效的方式体验技术。例如,当用户想要利用给定的电子装置执行给定的功能、但不一定了解如何着手执行该功能时,用户通常无法加入与该装置的多模式交互以仅发出自然语言的词来请求该功能。
而且,利用不具有语音识别能力的电子装置,相对简单的功能通常可能执行起来繁琐。例如,为移动电话购买新的电话铃声往往是很简单的过程,但用户通常必须导航若干菜单并按下很多不同的按钮来完成该过程。就这一点而言,很明显,如果用户能够使用自然语言来开发隐藏或其他难以使用的功能,则与电子装置的交互会有效得多。现有的系统具有这些问题和其他问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声钰科技,未经声钰科技许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080017511.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能低压电器辅助使用及故障处理系统
- 下一篇:信息处理装置及密码诊断方法