[发明专利]利用上下文信息调节语音识别在审
申请号: | 201510006921.3 | 申请日: | 2015-01-07 |
公开(公告)号: | CN104810019A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 罗德·D·沃特曼;马克·埃文·科恩 | 申请(专利权)人: | 联想(新加坡)私人有限公司 |
主分类号: | G10L15/187 | 分类号: | G10L15/187 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 新加坡*** | 国省代码: | 新加坡;SG |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 上下文 信息 调节 语音 识别 | ||
技术领域
本发明总体上涉及信息处理的技术领域,更具体地,涉及利用上下文信息调节语音识别。
背景技术
许多信息处理设备(“装置”)给用户提供输入语音命令或提供语音输入的能力。通常,自动语音识别(ASR)引擎试图识别口头语言并且随后将用户的语音输入匹配或映射到某些动作,例如基于语音的命令。
例如,用户可以说“电子邮件联系姓名A”,当ASR引擎从语法上分析和处理这句话时,在所有东西适当工作的情况下,将会导致“电子邮件”、“联系”和“姓名A”的识别的语音。此外,同样在所有东西适当工作的情况下,ASR引擎例如利用命令模板将这些特定字词映射或匹配到与自然语言含义匹配的命令输入,即电子邮件应用应当被用于开始起草新的电子邮件消息至“姓名A”的用户联系方式。基于该处理,装置因而可以响应于以适当方式输入的用户的自然语言。
发明内容
总的来说,一方面提供了一种方法,包括:利用处理器获得涉及信息处理设备的上下文信息;利用处理器通过使用上下文信息来调节自动语音识别引擎;在信息处理设备的音频接收器处接收用户语音输入;以及利用处理器、基于所接收的用户语音输入和对自动语音识别引擎的上下文信息调节来提供所识别的语音。
另一方面提供了一种信息处理设备,包括:音频接收器;操作上耦接到音频接收器的处理器;以及存储可由处理器执行的指令的存储器装置,处理器执行指令以:获得与信息处理设备有关的上下文信息;利用上下文信息来调节自动语音识别引擎;在音频接收器处接收用户语音输入;以及基于所接收的用户语音输入和对自动语音识别引擎的上下文信息调节来提供所识别的语音。
又另一方面提供了一种程序产品,包括:包括装置可读程序代码的存储介质,该代码可由处理器执行并且包括:用于利用处理器获得与信息处理设备有关的上下文信息的代码;用于利用处理器通过使用上下文信息来调节自动语音识别引擎的代码;用于在信息处理设备的音频接收器处接收用户语音输入的代码;以及用于利用处理器基于所接收的用户语音输入和对自动语音识别引擎的上下文信息调节来提供所识别的语音的代码。
以上内容是概要,并且因此可以包含详细内容的简化、概括和省略;因此,本领域的技术人员应当认识到,概要仅是说明性的,并且不旨在以任何方式进行限制。
为了更好地理解实施方式以及实施方式的其他和另外的特征和优点,结合附图参照下面的描述。在所附权利要求中指出本发明的范围。
附图说明
图1示出了信息处理设备的电路系统的示例;
图2示出了信息处理设备的电路系统的另一示例;
图3示出了用于利用上下文信息调节语音识别的示例性方法。
具体实施方式
容易理解,如本文附图中所示和一般描述的实施方式中的部件还可以被布置和设计成除所描述的示例性实施方式之外的多种不同的配置。因此,如图所示,对示例性实施方式的以下更详细的描述不旨在限制要求保护的实施方式的范围,而仅代表了示例性实施方式。
本说明书中提到的“一个实施方式”或“实施方式”(等)意为结合实施方式所描述的特定特性、结构或特征被包括在至少一个实施方式中。因此,本说明书中各种地方出现的短语“在一个实施方式中”或“在实施方式中”不一定都指同一实施方式。
此外,在一个或更多个实施方式中可以以任何适当的方式结合所描述的特性、结构或特征。在下面的描述中,提供许多特定细节以给出对实施方式的全面理解。然而,相关领域的技术人员将认识到,在没有一个或更多个特定细节的情况下或者利用其他方法、部件、材料等,也可以实践各种实施方式。在其他实例中,未详细描述或示出已知的结构、材料或操作以避免模糊。
在大多数情况下虽然ASR引擎趋于适当地忠实识别/鉴别字词,然而在某些方面尤其在嘈杂环境中,这个过程可能受挫。通过首先确定上下文,例如确定用户是否处于特定情形中或在执行特定任务,可以大大改进语音识别。
因此,实施方式获得这样的上下文信息并且使用上下文信息以使语音识别偏向于用户在特定上下文中最可能说或请求的字词和/或命令。例如,如果用户在听音乐,与完全不相关的事情相比,例如使用地图应用来搜索餐馆位置,其更可能的是,后续话语将是播放其他东西或调节音量的命令,或者是操作用于音乐播放器应用的命令等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(新加坡)私人有限公司,未经联想(新加坡)私人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510006921.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于语音信号增强的谱减法
- 下一篇:基于语义分析的口语评测方法和系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置