[发明专利]用于无监督语言模型权重选择的最佳路径变化率在审
申请号: | 202080015407.5 | 申请日: | 2020-02-14 |
公开(公告)号: | CN113939869A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 王培栋;崔佳;翁超;俞栋 | 申请(专利权)人: | 腾讯美国有限责任公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L19/24;G10L15/18 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 美国加利福尼亚州*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 监督 语言 模型 权重 选择 最佳 路径 变化 | ||
1.一种选择用于执行自动语音识别的最优语言模型权重(LMW)的方法,所述方法包括:
使用语言模型将测试音频解码成词格;
使用多个LMW中的第一LMW来分析所述词格,以确定第一多个最佳路径;
使用所述多个LMW中的第二LMW分析所述词格,以确定第二多个最佳路径;
基于所述第一多个最佳路径与所述第二多个最佳路径之间的最佳路径变化的数量,确定对应于所述第一LMW的第一最佳路径变化率BCPR;以及
基于所述第一BCPR为对应于所述多个LMW的多个BCPR中的最小BCPR,来确定所述第一LMW为所述最优LMW。
2.根据权利要求1所述的方法,其中,所述多个LMW包括用于将所述语言模型与声学模型相组合的多个缩放因子。
3.根据权利要求1所述的方法,其中,所述多个LMW中的每个LMW与所述多个LMW中的相邻LMW以固定步长分隔开。
4.根据权利要求1所述的方法,其中,对应于所述第一多个最佳路径的多个得分中的每个得分包括由所述第一LMW平衡的声学得分和语言模型得分的组合,并且其中,所述第一多个最佳路径中的每个最佳路径包括所述词格中具有最大得分的路径。
5.根据权利要求1所述的方法,其中,所述最佳路径变化的数量表示为如下:
其中c(w)表示所述最佳路径变化的数量,s是话语的索引,S表示对应于所述测试音频的数据集中的话语,δ()表示克罗内克δ函数,ps()表示最佳路径,w表示所述第一LMW,ε表示固定步长,以及w+ε表示所述第二LMW。
6.根据权利要求5所述的方法,其中,所述第一BCPR表示为如下:
其中r(w)表示所述第一BCPR,N表示所述数据集中的话语总数。
7.根据权利要求6所述的方法,其中,对应于所述BCPR的连续函数表示为如下:
R(wc)=Ir(wc)+Dr(wc),
其中R(wc)表示对应于所述BCPR的所述连续函数,其中Ir(wc)表示在LMW变化之后增加字错误率的最佳路径的归一化数量,以及Dr(wc)表示在所述LMW变化之后减少所述字错误率的最佳路径的归一化数量。
8.根据权利要求7所述的方法,其中,Ir(wc)和Dr(wc)表示为如下:
以及
其中wopt表示所述最优LMW,k表示(k≥0)斜率,bI表示Ir(wc)的截距,以及bD表示Dr(wc)的截距。
9.根据权利要求8所述的方法,其中,R(wc)表示为如下:
以及其中,R'(wopt)如下表示:
10.根据权利要求9所述的方法,其中,基于在所述多个BCPR中所述第一BCPR最接近R'(wopt)的最小值,确定所述第一LMW为所述最优LMW。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080015407.5/1.html,转载请声明来源钻瓜专利网。