[发明专利]用于高效且精确译码的增量言语译码器组合在审

专利信息
申请号: 202010566109.7 申请日: 2015-03-17
公开(公告)号: CN111785263A 公开(公告)日: 2020-10-16
发明(设计)人: S·张;M·列维特;A·拉希里;B·奥乌兹;B·杜莫林 申请(专利权)人: 微软技术许可有限责任公司
主分类号: G10L15/14 分类号: G10L15/14;G10L15/06;G10L15/32;G10L19/005
代理公司: 永新专利商标代理有限公司 72002 代理人: 贾丽萍
地址: 美国华*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 高效 精确 译码 增量 言语 译码器 组合
【说明书】:

一种增量语言识别系统。该增量语言识别系统仅当额外的言语译码器很可能对组合结果增加显著益处时才使用额外的言语译码器对所讲言语进行增量地译码。基于精度、性能、多样性和其它因素对可用的言语译码器按系列进行定序。识别管理引擎协调言语译码器系列对所讲言语的译码,组合译码后言语,以及判定额外的处理是否可能显著地改善识别结果,如果是,则识别管理引擎接合下一言语译码器且循环继续。如果精度不能得到显著改善,则结果被接受,译码停止。因此,精度接近该系列的最大值的译码后言语被获得,而不使用系列中的全部言语译码器对所讲言语进行译码,从而最小化资源使用。

本申请是申请号为201580014680.5的中国申请“用于高效且精确译码的增量言语译码器组合”的分案申请。

背景技术

离线(即,非实时)语言识别系统用于不要求对所讲言语进行同时回应的方案中。使用离线语言识别的示例包括生成无监督训练数据用于语言和声音建模、音频检索以及自动语言邮件转录。在没有实时约束的情况下,存在传递所讲言语通过多个言语译码器从而降低识别错误率的选择;然而,必须仍考虑资源成本。当每个所讲言语由远少于全部可用的离线言语译码器的多个离线言语译码器进行处理时,在计算力、存储、时间和其它资源方面的要求迅速变得重要。因此,甚至对于离线语言识别,必须针对使用附加系统获得识别错误率降低的益处来衡量成本。

正是针对这些以及其它考虑,做出了本发明。虽然已经论述了相对具体的问题,应当理解,本文公开的实施例不应限于解决在背景技术中提到的具体问题。

发明内容

提供该概述以便以下文在详述部分中进一步描述的简化形式来引入构思的选择。该概述不意在确定权利要求主题的关键特征或主要特征,也不意在该概述用作确定权利要求主题的范围的辅助。

仅当额外的言语译码器很可能对组合结果增加显著的益处时,增量语言识别系统的实施例才使用下一言语译码器对所讲言语进行增量地译码。基于精度、性能、多样性和其它因素在系列中对多个言语译码器进行排序。识别管理引擎通过言语译码器系列协调所讲言语的增量译码,组合译码后言语,并且判定额外的处理是否很可能显著地改善结果。如果是,则识别管理引擎接合下一言语译码器且循环继续。如果结果不可能显著地改善,则结果被接受且译码停止。

可以针对注解训练数据来测试可用的言语译码器以发展用于对言语译码器排序的识别精度、系统多样性、性能或其它度量。基于该排序,言语译码器被排序成系列。言语译码器的排序是可选的以基于方案要求来提供精度与资源使用之间的权衡。

在配置之后,所讲言语由系列中的连续的言语译码器进行顺序地处理。言语译码器对所讲言语进行译码且将识别结果返回到识别管理器。如果没有可用的在先识别结果,则将当前结果处理为提议识别结果。对于对所讲言语进行译码的第二尝试和后续尝试,将新识别结果与在先识别结果组合以产生新的提议识别结果。

识别管理器基于与提议识别结果的组件关联的性能分数来确定所述提议识别结果的估计可靠性。识别结果可以包括通过言语译码器生成的译码后言语以及性能分数。在各实施例中,可利用组合结果中的每个译码后言语的诸如识别置信度的性能分数或者为统计分类器馈送与提议识别结果的组件相关联的各个分数来获得估计可靠性。

将估计可靠性与接受阈值进行比较以判定是否将额外的资源投入于识别所讲言语。如果估计可靠性值满足或超过阈值,则提议识别结果被接受最为最终识别结果,并且所讲言语的识别结束。

在正常情形下,全部可用的言语译码器需要对较少的所讲言语进行译码,但是最终的译码后言语组合将具有接近以及经常是非常接近如果用全部可用的言语译码器对所讲言语进行译码且将译码后言语组合所能得到的最大值的精度。总体来讲,增量语言识别系统能够以小的代价捕获全部的多个言语译码器组合的几乎全部益处。

附图说明

通过参考以下的附图能够最佳地理解本公开的进一步的特征、方面和优点,其中为了更清楚地显示出细节元件不是按比例绘制,并且其中相似的附图标记在全部视图中指示相似的元件:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010566109.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top