[发明专利]基于用户反馈来改善自动语音识别在审

申请号：	202111227601.2	申请日：	2015-08-26
公开（公告）号：	CN113948083A	公开（公告）日：	2022-01-18
发明（设计）人：	M·克里斯纳莫尔泰;M·鲍立克	申请（专利权）人：	苹果公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/01;G10L15/32
代理公司：	北京市金杜律师事务所 11256	代理人：	姚杰
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于用户反馈改善自动语音识别
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开的实施例涉及基于用户反馈来改善自动语音识别。本发明提供了用于在数字助理中处理语音的系统和过程。在一示例性过程中，可从用户接收第一语音输入。可利用第一自动语音识别系统来处理第一语音输入以生成第一识别结果。可接收指示第一识别结果中的潜在错误的输入。该输入可用于改善第一识别结果。例如，该输入可包括第二语音输入，该第二语音输入是第一语音输入的重复。可利用第二自动语音识别系统来处理第二语音输入以生成第二识别结果。

本申请是国际申请号为PCT/US2015/047062、国际申请日为2015年8月26日、进入中国国家阶段日期为2017年2月27日、中国国家申请号为201580046330.7、发明名称为“基于用户反馈来改善自动语音识别”的发明专利申请的分案申请。

相关申请的交叉引用

本专利申请要求于2014年8月28日提交的标题为“AUTOMATIC SPEECHRECOGNITION BASED ON USER FEEDBACK”的美国临时专利申请62/043,041和于2015年1月7日提交的标题为“AUTOMATIC SPEECH RECOGNITION BASED ON USER FEEDBACK”的美国非临时专利申请14/591,754的优先权，这两个美国专利申请全文以引用方式并入本文以用于所有目的。

技术领域

本文整体涉及自动语音识别，更具体地涉及基于用户反馈来改善自动语音识别。

背景技术

自动语音识别(ASR)系统可能遭遇转录错误。这些错误的出现可能是由于多种原因，诸如混乱的语音输入、背景嘈杂的语音输入、或者包含发音与其它字词类似的字词的语音输入。另外，在实时ASR系统中，为了实现可接受的迟延时间，可对准确性作出妥协。例如，可实现较小词汇模型或稳健性较低的语音识别引擎。这些妥协可能促成转录错误。常规地，ASR系统所接收的每个语音输入可进行相同地处理。然而，相同地处理所有语音输入可能导致类似的转录错误反复地重新出现，这可能导致用户方灰心沮丧以及差的用户体验。

发明内容

本文提供了用于在数字助理中处理语音的系统和过程。在示例性过程中，可从用户接收第一语音输入。可利用第一自动语音识别系统处理第一语音输入来生成第一识别结果。可接收指示第一识别结果中的潜在错误的输入。该输入可用于改善第一识别结果。

在一些实施例中，该输入可包括第二语音输入，该第二语音输入是第一语音输入的重复。可利用第二自动语音识别系统处理第二语音输入来生成第二识别结果。

在一些实施例中，可提示用户重复第一语音输入的至少一部分。可从用户输入接收第三语音输入，该第三语音输入是第一语音输入的重复。可利用第二自动语音识别系统处理第三语音输入来生成第三识别结果。

在一些实施例中，可利用第二自动语音识别系统处理第一语音输入来生成第四识别结果。

附图说明

图1示出了根据各种实施例的用于实施数字助理的系统和环境。

图2示出了根据各种实施例的实施数字助理的客户端侧部分的用户设备。

图3A示出了根据各种实施例的数字助理系统或其服务器部分。

图3B示出了根据各种实施例的图3A所示数字助理的功能。

图4A-图4B示出了根据各种实施例的用于处理语音的过程。

图5示出了根据各种示例的电子设备的功能框图。