[发明专利]识别语音识别引擎的输入在审
申请号: | 202080044362.4 | 申请日: | 2020-04-16 |
公开(公告)号: | CN113994424A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | A·R·希德;T·阿罗拉 | 申请(专利权)人: | 奇跃公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/26;G10L25/87;G10L25/93 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;牛南辉 |
地址: | 美国佛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 语音 引擎 输入 | ||
公开了一种向语音识别引擎呈现信号的方法。根据该方法的示例,从用户处接收音频信号。识别音频信号的一部分,该部分具有第一时间和第二时间。识别音频信号的该部分中的停顿,该停顿包括第二时间。确定停顿是否指示音频信号的话语的完成。根据确定停顿指示话语的完成,音频信号的该部分作为输入呈现给语音识别引擎。根据确定停顿不指示话语的完成,音频信号的该部分不作为输入呈现给语音识别引擎。
相关申请的交叉引用
本申请根据35U.S.C.§119主张2019年4月19日提交的美国临时专利申请62/836,593的优先权,为所有目的该申请的全部内容通过引用并入此文。
技术领域
本公开一般地涉及处理语音信号的系统和方法,更具体地,涉及处理呈现给语音识别引擎的语音信号的系统和方法。
背景技术
用于语音识别的系统的任务是通常经由一个或多个麦克风接收表示人类语音的音频输入,然后处理音频输入以确定与该音频输入相对应的词、逻辑结构、或其他输出。例如,自动语音识别(ASR)系统可以基于与音频输入信号相对应的人类语音生成文本输出;自然语言处理(NLP)工具可以生成与人类语音含义相对应的逻辑结构或计算机数据。虽然一些ASR系统可能对预先录制的大量语音进行操作—例如,一个系统的任务是创建前一天由麦克风录制的语音的书面抄本—但一些ASR系统必须对实时提供的语音输入做出响应。实时语音处理给ASR系统带来了一系列独特的挑战。例如,ASR系统通常不是将语音作为单一的输入块来处理,而是作为一系列承载含义的单个单词或短语(“话语(utterance)”)来处理。
识别话语何时开始和结束对于ASR系统准确处理用户的输入语音并提供所需的结果可能是至关重要的。例如,考虑与天气报告服务通信的实时“语音助手”ASR系统:该ASR系统可以接收来自询问天气的用户的语音输入(例如,“当前天气如何?”);将语音输入转换为结构化查询(例如,查询指示特定日期和时间以及特定位置的过去、当前或预测的未来的天气的数据);将结构化查询呈现给天气报告服务;从服务接收查询结果;并将查询结果呈现给用户。用户希望ASR系统处理他或她的完整问题(而不是问题的单个片段),并迅速提供准确的响应。用户进一步希望ASR系统将处理不需要遵循特定、严格格式的自然口语命令。在这个示例系统中,ASR有责任实时识别用户的完整问题;并及时—理想情况下,在用户完成了问题的提问之后立即—处理问题以产生准确的响应。
在该示例系统中,响应的准确性可能取决于ASR系统何时确定用户的问题(话语)完成。例如,用户可能会问:“明天天气如何?”如果ASR系统在“天气怎么样”之后过早地确定话语完成,则它对天气服务的对应查询将省略修饰词“明天”,因此得到的响应将是不准确的(它不会反映用户期望的日期/时间)。相反,如果ASR系统采取更保守的方法,并在处理话语之前等待几秒钟以确认整个话语已完成,则用户可能不会认为ASR系统对他或她的命令有足够的响应(此外,在某些情况下,如此长的等待时段可能会因在话语中包含不相关的后续语音而造成不准确)。
ASR系统努力解决这个迅速、实时地确定说话者的话语何时完成的问题。在一些系统中,使用固定的超时时段来确定话语的终结点:如果在语音输入之后,在超时时段的持续时间(例如,750ms)内没有接收到语音,则语音输入可能被认为是话语的结束。但是,固定超时时段的解决方案并不完美:例如,在用户停顿以构思问题的情况下;用户暂时被打断的情况下;或者在用户的讲话不流利的情况下(例如,由于焦虑、语言障碍、环境干扰、认知负荷等),超时时段可能会在用户话语完成之前终止。相反,一旦用户的话语完成,响应至少会延迟超时时段的持续时间(在此期间ASR系统确认没有收到进一步的输入),并且用户无法在这段持续时间内提供额外的语音输入(例如,属于新的话语)。这种交互限制了ASR系统的实用性,并且可能无益地突显用户正在与机器而不是另一个人进行通信。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇跃公司,未经奇跃公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080044362.4/2.html,转载请声明来源钻瓜专利网。