[发明专利]一种应用于语音识别系统的高性能置信度处理方法无效
申请号: | 200810110479.9 | 申请日: | 2008-06-05 |
公开(公告)号: | CN101447183A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | 颜永红;黎塔;潘接林;赵庆卫 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 北京法思腾知识产权代理有限公司 | 代理人: | 杨小蓉 |
地址: | 100190北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种应用于语音识别系统的高性能置信度处理方法,其框架是基于一遍语音识别解码完成,在一遍语音识别过程中得到多个知识源,通过多个知识源融合处理得到置信度。本发明的语音识别置信度评价方法,只使用了一遍语音识别解码,同时利用了多个知识源,与以往的方法相比,该方法在大幅提高计算速度的同时,也使置信度计算的结果更为准确有效。 | ||
搜索关键词: | 一种 应用于 语音 识别 系统 性能 置信 处理 方法 | ||
【主权项】:
1、一种应用于语音识别系统的高性能置信度处理方法,其框架是基于一遍语音识别解码完成,在一遍语音识别过程中得到多个知识源,通过多个知识源融合计算置信度,具体包括以下步骤:1)使用电话语音识别引擎对输入语音逐帧进行解码识别;2)在步骤1)还没有解码完最后一帧语音前,在每一帧语音数据解码中,首先得到当前帧活跃状态的观察概率P(xt|sj),其中xt是当前帧语音信号的特征,sj是当前活跃状态集合D中的一个;同时将所有活跃状态的观察概率相加并保存到内存中;3)解码完最后一帧数据,在得到识别结果前,获取输入语音的词图;4)在步骤3)中得到词图后,随即得到识别结果,也即完成了语音数据的解码识别过程,得到识别结果同时还得到其相对应的音素序列,以及每个音素所对应的起止时间点和每个音素的识别似然概率;5)完成步骤4)后,进行同步声学后验概率计算,即,通过前面保存的每一帧的活跃状态的观察概率之和,和每个音素的起止时间及其似然概率,求出相应的每个音素的后验概率;6)完成步骤4)后,进行词图后验概率计算,即,通过前面得到的输入语音词图,根据词图上的信息相应也计算出每个音素的后验概率,通过算术平均得到对数域的词图后验概率;7)将在步骤5)得到的同步声学后验概率和步骤6)得到的词图后验概率两个来自不同知识源的后验概率融合即求出最后的识别结果的融合后验概率;8)将在步骤7)得到的融合后验概率通过定制的映射函数将后验概率映射为置信度分数,即为最后得到的识别结果的置信度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810110479.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种石斛种植方法
- 下一篇:一种石油超级活性粉剂