[发明专利]短语辨认系统和方法有效
申请号: | 201310462805.3 | 申请日: | 2013-10-08 |
公开(公告)号: | CN103714813B | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | S·沙弗尔;K·庞廷;V·C·马图拉 | 申请(专利权)人: | 阿瓦亚公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 李晓芳 |
地址: | 美国新*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 短语 辨认 系统 方法 | ||
技术领域
提供用于短语辨认(spotting)方法和系统。
背景技术
在各种应用中,期望检测什么时候已经说出特定的短语。然而,目前的短语辨认产品可能遭受不准确的短语辨认。此外,此类产品常常不为说话者提供引导系统并改善它的性能的手段。具体地,说话者的独特口音可能不利地影响辨认具体短语的准确度。
为了改善短语辨认系统的准确度,可以使用训练模式。在训练期间,要求用户响应于提示提供语音样本。虽然此类训练可能在对各个用户的文本到语音系统的准确度的提高方面是有效的,但是此类训练是费时的。另外,当试图辨认由未知或随机说话者说出的具体短语时,可以证明如上所述的传统训练是不实际的。为了提供用于诸如进入联系中心的呼叫者之类的较大用户群的改善的准确度,各个用户可以被分配到简档类别。例如,具有澳大利亚口音的用户可以与用来准确地辨认带有那种口音说出的短语的简档相关联。
在特定背景中,诸如在联系中心中,可以期望监控包括用于特定关键字或短语的语音的音频信号。例如,企业可以对监控联系中心代理和客户之间的会话以寻找特定词感兴趣。作为特定示例,联系中心服务器可以实时监控呼叫以寻找词“监督器”。如果检测到那个词,则它可以被用作到监督器的触发器以在呼叫中干涉,或监控正在进行的呼叫。如另一个示例,金融机构可以例行地记录客户呼叫,以使得可以维护客户指示的准确记录。如果稍后出现关于客户的较早指示的内容的问题,则可以期望通过搜索由客户和联系中心代理之间的较早会话构成的记录以定位并重放较早的指示。然而,在此情况中,基本没有或没有机会来训练系统准确地识别被监控的语音。因此,用于训练系统的先前技术在这些其它背景中已经无效。
发明内容
提供改善的与词或短语辨认有关的短语辨认准确度的系统和方法。更具体地,为一个或多个词或短语实时监控语音。当系统确定已经发出某一词或短语时,可以显示要求由系统识别的短语被实际说出的确认的消息。响应于具体短语已被说出的确认,短语的副本可以被存储在短语库中并且用于提高相对于各个说话者、另一个用户、或具有某些共性的一群用户的语音识别的准确度。
根据本公开的至少某些实施例,例如,由监控应用监控例如但是不限于电话会话的音频流。监控应用侦听音频流以寻找一个或多个具体短语。如这里使用的,短语可以包括短语、词、音素,或语音的其它部分。响应于由监控应用确定已经识别指定短语,可以创建隐含马尔可夫模型。另外,从用户请求短语被包括在音频流中的验证。可以向提供语音的用户做出此验证请求。此外,验证请求可以被作为询问指定短语是否由用户实际说出的显示的消息呈现。如果用户作肯定回答,则可以存储包括指定短语的音频流的部分。然后可以由监控应用使用存储的短语以识别那些短语的未来发声。被要求验证已经说出指定短语的用户不必须是其语音流被监控的相同的人员。
实现本公开的实施例的系统可以提供运行监控应用的通信服务器。可以由管理员或监督器提供监控应用以监控一个或多个音频流以寻找指定短语。监控应用然后操作以“侦听”语音通信以寻找一个或多个指定短语。响应于确定指定短语已被发出,监控应用请求来自人类听众或可以是代理或监督器用户的参与者的指定短语已被实际发出的确认。请求也可以包括向联系中心客户用户呈现文本来声明短语已被监控应用识别,并且进一步请求来自于客户用户的确认。在另外的实施例中,用户可以是一个或多个用户并可以具有以上使用的关系的不同关系。响应于输入的指定短语在音频流中出现的确认,监控应用可以存储包括指定短语的音频流的部分。存储的短语然后可以用于识别那些短语的后续发声。通过如此提供指定短语的客户用户的发声的实际示例,那些短语可以在未来的来自于客户用户或来自于具有相似口音或语音模式的其它客户用户的语音通信中利用更高的准确度被识别。可替换地,如果代理或客户用户指示没有发出指定短语,则监控应用可以继续使用通常应用于用户的标准文本文件。另外,被错误地识别为包含指定短语的语音片段可以被存储以作将来参考并且用于减少未来指定短语的错误检测。根据本公开的进一步的实施例,可以为各个用户或具有相似口音或语音模式的用户类别发展指定短语库。此外,可以将库解析到可以用于识别包括在或包括除了那些其样本已经获得的词或短语之外的词或短语的指定短语的音素库中。类似地,系统为用户提供每当用户确定已经发出指定短语并且系统没有辨认它时就提醒系统的能力。当这出现时,系统可以以类似于如上所述的一个方式存储有关的语音流片段以作将来参考。
本发明的实施例的附加特征和优点将从下列说明书中变得更清晰,特别是结合附图时。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿瓦亚公司,未经阿瓦亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310462805.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理的方法及电子设备
- 下一篇:一种电热水器的防触电保护结构