[发明专利]用于使用上下文信息的语音识别修复的方法和系统有效
申请号: | 201210369739.0 | 申请日: | 2012-09-28 |
公开(公告)号: | CN103035240A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | 陈力 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 刘国伟 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 使用 上下文 信息 语音 识别 修复 方法 系统 | ||
技术领域
本发明涉及语音识别系统,且在一个实施例中,涉及用以控制数据处理系统的语音识别系统。
背景技术
许多语音识别系统所具有的常见问题是准确性。用户可对着语音识别器说话,且系统可用识别文本做出响应,但所述识别文本通常可能含有许多错误,因为语音识别器未能恰当地识别人类用户的话语。
语音识别可用以在电话上调用话音拨号,例如当用户在电话上口述命令“call mom(呼叫妈妈)”时。使用语音来控制数据处理系统可在来自语音识别器系统的转录错误决定用户口述“call Tom(呼叫汤姆)”而非“call mom(呼叫妈妈)”时导致异常系统行为。转录错误可由硬件缺点(例如不能够经由蓝牙头戴式耳机俘获高质量音频记录)或用户错误(例如不正确或不完全的发音或背景噪声)造成。一些语音识别系统可采用使用上下文来改善语音识别系统;美国专利7,478,037提供可采用上下文来辅助语音识别过程的语音识别系统的实例。
发明内容
本发明的实施例提供一种语音控制系统,其可识别口述命令和相关联字词(例如“呼叫在家里的妈妈”)且可致使选定应用程序(例如电话拨号器)执行所述命令以致使系统(其可为智能电话)执行基于所述命令和相关联字词的操作(例如,向在家里的妈妈发出电话呼叫)。在一个实施例中,所述语音控制系统可使用包括常规声学模型和常规语言模型的语言识别器来根据从人类用户的语音获得的数字化输入产生文本输出。在一个实施例中,所述语音控制系统可由用户可调用的语音辅助应用程序来启动,且此语音辅助应用程序可解释并修复来自所述语音识别器的所述文本输出且将经修复的文本输出提供到一组应用程序中的选定应用程序;所述组应用程序可包括(例如)一个或一个以上应用程序,例如电话应用程序(用以拨号并建立话音电话呼叫连接)和媒体播放器应用程序(例如,iTunes)和SMS(短消息服务)“文本消息”应用程序和视频会议(例如,“面对面时间(FaceTime)”)或聊天应用程序和用以找到或定位例如朋友等个人的应用程序和其它应用程序。
在一个实施例中,语音辅助应用程序使用一组解释器来解释所述文本输出,所述解释器中的每一者经设计以解释所述组应用程序所使用的特定类型的文本。举例来说,名字解释器经设计以解释地址簿或通讯录数据库中的名字(在名字字段中),姓氏解释器经设计以解释地址簿或通讯录数据库中的姓氏(在姓氏字段中),全名解释器经设计以解释地址簿或通讯录数据库中的全名,且公司名称解释器经设计以解释地址簿或通讯录数据库中的公司名称。在一个实施例中,这些解释器可经配置以使用不同算法或过程来解释文本输出中的每一字词;举例来说,全名解释器可使用模拟匹配(使用编辑距离相似性测量)算法来将文本输出中的字词与地址簿或通讯录数据库中的字词进行比较,但在一个实施例中,不使用n码组(n-gram)算法来将文本输出中的字词与地址簿或通讯录数据库中的字词进行比较,而名字解释器使用n码组算法来将文本输出中的字词与地址簿或通讯录数据库中的字词进行比较。此外,在一个实施例中,这些解释器可在搜索地址簿或通讯录数据库以查找匹配时使用不同搜索算法。在一个实施例中,每一解释器还可在解释字词时使用上下文(例如,所述上下文可包括媒体播放器正在播放歌曲的指示)。在一个实施例中,所述上下文可包括用户输入历史(例如会话历史(例如,先前识别语音))或所述组应用程序中的应用程序的状态等。在一个实施例中,所述组中的每一解释器可处理文本输出中的每一字词以试图确定其是否能修复所述字词,且在一个实施例中,每一解释器自行决定其是否能修复每一字词;所述解释器产生指示其是否能修复所述字词的得分或置信度。
在一个实施例中,所述组解释器的控制器可通过排列所得的经修复解释(使用每一解释器的得分或置信度来执行所述排列)且接着合并所述经排列的解释来处理所述组解释器的结果。在一个实施例中,所述合并设法避免解释的重叠,使得仅使用来自一个解释器的输出来修复特定字词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210369739.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于乙烯的聚合物组合物
- 下一篇:增加大直径预应力管桩水平承载力的结构
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置