[发明专利]一种基于自适应热词权重的语音识别方法及系统有效
申请号: | 201811571564.5 | 申请日: | 2018-12-21 |
公开(公告)号: | CN111354347B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 黎塔;缪浩然;张鹏远;高圣翔;黄远;沈亮;林格平 | 申请(专利权)人: | 中国科学院声学研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 权重 语音 识别 方法 系统 | ||
1.一种基于自适应热词权重的语音识别方法,所述方法包括:
生成热词网络并和静态解码网络一起加载到语音识别解码器中;
将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递,自适应地计算热词权重,并对静态解码网络上令牌的分数重新打分;输出解码结果;
所述生成热词网络的步骤包括:
步骤1)接收自定义的热词以及对每个热词设置的权重;
步骤2)对步骤1)得到的热词表进行预处理;
步骤3)基于步骤2)的热词表构造一个热词相关的加权有限状态转换机,即为热词网络;
所述热词相关的加权有限状态转换机网络表示为定义在一组权重上的八元组(∑,Δ,Q,I,F,E,λ,ρ);其中∑是输入符号的有限集合,Δ是输出符号的有限集合,Q是有限状态的集合,是起始状态集合,是终止状态集合,是有限转移边的集合,其中∈代表转移边上的输入或输出符号为空字符;λ和ρ分别表示起始权重和终止权重;
所述同步地在静态解码网络和热词网络上进行令牌传递的步骤具体包括:
步骤S1)初始化静态解码网络上的令牌ts,从静态解码网络的起始状态开始传递;
步骤S2)初始化热词网络上的令牌th,构成令牌集合T,并链接到静态解码网络上初始化的令牌ts,th从热词网络的起始状态开始传递;
步骤S3)向静态解码网络输入一帧待识别语音的特征,其上的令牌ts传递到下一个状态,记经过的转移边为es,输出字符s,累计路径上的得分;
步骤S4)判断是否传递到终止状态,若传递到终止状态,转入步骤S8);否则,转入步骤S5)继续执行;
步骤S5)判断输出字符s是否为空字符;若s是空字符,转入步骤S3);否则转入步骤S6)继续执行;
步骤S6)向热词网络输入字符s,更新ts链接的令牌集合T:T中的每个令牌th传递到满足条件的一个或多个状态,记经过的转移边为eh,分别计算路径得分的增量δ,采用公式:
公式中的Wh(eh)和Ws(es)分别为eh和es上的权重,有三种情况:
(1)Wh(eh)>0,代表eh与热词有关,Wh(eh)等于自定义热词的权重除以热词的字符串长度,权重越高Δ越大;Ws(es)为语言模型中的对数概率,Ws(es)为负值,α是非负参数,因此热词网络输入的字符在语言模型中概率越小δ越大;
(2)Wh(eh)<0,代表eh为空字符转移边,无法继续在热词相关的路径上传递,需要减去先前累计的权重值W;
(3)Wh(eh)=0,代表eh与热词无关,因此得分增量为零;
步骤S7)更新ts的得分,其得分增量为令牌集合T中得分增量的最大值;更新结束后,转入步骤S3);
步骤S8)结束令牌传递并输出字符串以及对应的分数作为解码结果。
2.根据权利要求1所述的基于自适应热词权重的语音识别方法,其特征在于,所述自定义的热词为集内词、集外词或者短语;所述权重为浮点数,权重与该热词在识别结果中的召回率成正相关。
3.根据权利要求2所述的基于自适应热词权重的语音识别方法,其特征在于,所述步骤2)具体为:当热词包含中文时,对该热词使用词汇表进行分词,确保每一条热词由一个或多个集内词构成;分词采用逆向最大匹配算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;国家计算机网络与信息安全管理中心,未经中国科学院声学研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811571564.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种内燃机车喷油器专用拆装工具
- 下一篇:一种企业环保管理及报告系统