[发明专利]用于高效且精确译码的增量言语译码器组合在审
申请号: | 202010566109.7 | 申请日: | 2015-03-17 |
公开(公告)号: | CN111785263A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | S·张;M·列维特;A·拉希里;B·奥乌兹;B·杜莫林 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/06;G10L15/32;G10L19/005 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 贾丽萍 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 高效 精确 译码 增量 言语 译码器 组合 | ||
1.一种用于利用多个言语译码器来对所讲言语进行精确译码的方法,所述方法包括:
基于文字错误率来确定第一言语译码器;
基于每个单独的言语译码器的文字错误率和对所述第一言语译码器的结果同意的可能性来计算多个其它言语译码器中的每个言语译码器的系统多样性度量值;
将所述多个言语译码器定序为系列,所述多个言语译码器是根据所计算的系统多样性度量值来定序的;
利用所述系列中的所述第一言语译码器和所述系列中的第二言语译码器来对所讲言语进行译码;以及
将来自所述第一言语译码器和所述第二言语译码器的结果合并。
2.根据权利要求1所述的方法,还包括:
评估合并的结果的精度水平;以及
在确定所述合并的结果的精度水平可接受时,停止对所讲言语进行译码。
3.根据权利要求2所述的方法,其中,所述精度水平是基于由所述多个言语译码器返回的置信值来确定的。
4.根据权利要求1所述的方法,还包括:
确定所述多个言语译码器中的每个额外的言语译码器不太可能能够对所讲言语进行精确地译码;以及
停止对所讲言语进行译码。
5.根据权利要求4所述的方法,其中,译码后的所讲言语的精度是基于由所述多个言语译码器返回的置信值来确定的。
6.根据权利要求1所述的方法,还包括:
利用所述多个言语译码器中的额外的言语译码器来对所讲言语进行译码以获得额外的结果;
将所述额外的结果与合并的结果进行组合,以产生组合识别结果;以及
如果精确则接受所述组合识别结果。
7.根据权利要求1所述的方法,其中,所述第一言语译码器具有所述多个言语译码器中的最低文字错误率,并且所述第二言语译码器是基于度量来识别的,所述度量包括从所述第二言语译码器的文字错误率和对所述第一言语译码器的同意率推导出的加权和。
8.一种增量语言识别系统,包括:
至少一个处理器;以及
操作地连接到所述至少一个处理器的存储器,所述存储器包括计算机可执行指令,当由所述至少一个处理器执行时,所述计算机可执行指令执行包括以下操作的方法:
存储与所讲言语相对应的音频数据;
基于文字错误率来确定多个语言译码模型中的第一语言译码模型;
利用所述第一语言译码模型来对所讲言语进行译码;
基于每个单独的语言译码模型的文字错误率和对所述第一语言译码模型针对所讲言语的结果同意的可能性来计算多个其它语言译码模型中的每个语言译码模型的系统多样性度量值;
将所述多个语言译码模型定序为系列,所述多个语言译码模型是根据所计算的系统多样性度量值来定序的;以及
利用所述系列中的第二语言译码模型来对所讲言语进行译码。
9.根据权利要求8所述的增量语言识别系统,其中,所述计算机可执行指令还能由所述至少一个处理器执行以用于以下操作:
将来自所述第一语言译码模型和所述第二语言译码模型的结果合并。
10.根据权利要求9所述的增量语言识别系统,其中,所述计算机可执行指令还能由所述至少一个处理器执行以用于以下操作:
评估合并的结果的精度水平;以及
在确定所述合并的结果的精度水平可接受时,停止对所讲言语进行译码。
11.根据权利要求10所述的增量语言识别系统,其中,所述精度水平是基于由所述第一语言译码模型和所述第二语言译码模型返回的置信值来确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010566109.7/1.html,转载请声明来源钻瓜专利网。