[发明专利]基于置信度的关键词检出系统裁剪方法无效
申请号: | 201110280603.8 | 申请日: | 2011-09-21 |
公开(公告)号: | CN102402984A | 公开(公告)日: | 2012-04-04 |
发明(设计)人: | 韩纪庆;袁浩;李海洋 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/00;G06F17/30 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 韩末洙 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 置信 关键词 检出 系统 裁剪 方法 | ||
技术领域
本发明涉及一种关键词检出系统中的局部路径裁剪方法,具体是在基于似然分裁剪的基础上添加基于置信度裁剪的方法。
背景技术
关键词检出是从连续语音中识别出一组给定词的过程,它是一种非受限的语音信号处理系统,允许用户采用自然的说话方式,而不必局限于特定的语法。虽然近年来关键词检出技术获得了长足的进步,但是其检出效率仍不够高。一般的关键词检出系统,检出率通常能达到90%以上,但是系统效率始终是制约其进一步发展的瓶颈。为此,人们引入Viterbi Beam解码过程来对未知语音进行解码,它基于似然分进行局部路径的裁剪。但是这种方法具有一定的局限性,如在解码过程中,没有考虑观察矢量的先验概率,解码得到的只是所有可能的词序列中与输入语音最匹配的词串,但是其置信度不一定足够高,也就是最匹配的词串不一定就是实际语音对应的词串。它只是扩展那些似然分高的局部路径,而忽略那些似然分低的局部路径,解码过程中完全没有考虑各条路径的可信程度。造成裁剪过程不充分,搜索空间中保留一些不可能的路径,增加系统的计算量,降低系统的实时性。因此,需要研究关键词检出中的裁剪过程,进一步提高系统的检出速度,改善系统的实时性。
发明内容
本发明的目的是为了解决现有关键词检出系统解码过程中,基于似然分的路径裁剪不能最大程度地缩减搜索空间,从而导致系统效率低下,关键词确认阶段计算量大的问题,本发明提供了一种基于置信度的关键词检出系统裁剪方法。
本发明的基于置信度的关键词检出系统裁剪方法是通过以下步骤实现的:
步骤一、输入语音信号,对输入的语音信号进行预处理,特征提取得到特征矢量序列X={x1,x2,...xs},其中S代表自然数;
步骤二、根据Viterbi解码算法,对每帧语音特征在预先定义的识别网络上进行解码,解码之前,为每条局部路径增加一个变量,用于记录该条局部路径上的累积置信度得分,并将累积置信度得分初始化为0;
步骤三、在t时刻,所有局部路径向前扩展一次,得相应局部路径的活动模块,然后计算每个活动模型的状态q产生特征矢量xt的概率,并累加到该条局部路径的似然分中,同时计算每个活动模型中状态q相对于xt的后验概率,再将后验概率累加到对应的局部路径的置信度得分中,获得每条局部路径的置信度得分,其中,xt∈X,1≤t≤S,t取自然数;
步骤四、进行基于似然分的状态层局部路径裁剪;
步骤五、进行基于置信度的状态层局部路径裁剪;
步骤六、判断是否到达语音末尾,是则转步骤七,否则转步骤二;
步骤七、根据解码过程中生成的网格回溯查找关键词,并基于后验概率确认关键词候选从而得到最终的识别结果,完成基于置信度的关键词检出系统裁剪方法。
本发明步骤三中获得每条局部路径的置信度得分的过程为:
步骤1、计算每个活动模型的状态q产生特征矢量xt的先验概率P(xt):设在处理xt时,系统存在N个活动模型,累加每个活动模型中包含的所有状态q产生特征矢量xt的概率,作为P(xt)的近似值,即:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110280603.8/2.html,转载请声明来源钻瓜专利网。