[发明专利]语音识别装置和方法无效
申请号: | 200710127193.7 | 申请日: | 2007-07-04 |
公开(公告)号: | CN101101751A | 公开(公告)日: | 2008-01-09 |
发明(设计)人: | 酒井优;田中信一 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/14 | 分类号: | G10L15/14 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 王英 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种本发明的实施例包括:声音处理功能、语音区间检测功能、词典功能、对照功能、搜索对象选择功能、存储功能以及确定功能,并且包括以下处理:基于束搜索选择搜索范围,设置并存储基准帧,存储某一转移路径的输出概率,确定是否存储了某一路径的输出概率,从而通过以下操作减少了输出概率的计算次数:基于束搜索选择搜索范围,在从设置基准帧到更新基准帧的时间间隔中只计算一次某一转移路径的输出概率,存储所计算的值,并且当转移路径的输出概率存储在后续的帧中时,使用所存储的值作为输出概率的近似值。 | ||
搜索关键词: | 语音 识别 装置 方法 | ||
【主权项】:
1.一种使用HMM(隐马尔可夫模型)从所提供的语音信号中识别语音的装置,包括:声音处理单元,用于从语音信号获取具有恒定时间宽度的每个帧的语音特征矢量;基准帧存储单元,用于确定各个帧中之一作为基准帧,并且存储基准帧的帧编号;基准帧更新单元,用于当从基准帧起已经经过了任意数量的帧时,将基准帧重置并且更新为基准帧之后的所述任意数量的帧之后的帧,并且继续更新直到序列中的最后一帧;第一搜索范围选择单元,用于根据对于基准帧的束搜索来选择HMM的第一搜索范围;第一输出概率计算单元,用于计算在第一搜索范围内的各个转移路径中的语音特征矢量的第一输出概率;第一输出概率存储单元,用于与各个转移路径相结合地存储第一输出概率;第一输出概率删除单元,用于当基准帧被更新时,删除与转移路径相结合而存储的所有的第一输出概率;第二搜索范围选择单元,用于当基准帧未被更新时,根据对于从基准帧到将更新的新的基准帧的时间间隔之内的各个帧的束搜索,选择各个帧中的HMM的第二搜索范围;第二输出概率计算单元,用于当未存储第一输出概率和从基准帧到当前帧之前紧挨着的帧的时间间隔中的输出概率时,计算转移路径的当前帧或转移路径的基准帧中的语音特征矢量的第二输出概率;确定单元,用于确定在当前帧的第二搜索范围内的各个转移路径中的第一输出概率、或者与基准帧和当前帧之间存在的已经过的帧有关的第二输出概率是否与转移路径相结合;近似值设置单元,用于当存储了与基准帧和当前帧之间的已经过的帧有关的第一输出概率或第二输出概率时,将与基准帧和当前帧之间的已经过的帧有关的第一输出概率或第二输出概率设置为转移路径的第二输出概率的近似值;第二输出概率存储单元,用于与转移路径相结合地存储第二输出概率;第二输出概率删除单元,用于当基准帧被更新时,删除与转移路径相结合而存储的所有第二输出概率;前向概率计算单元,用于根据预先计算的前一帧的前向概率、当前帧的所有近似值以及所有第二输出概率来计算当前帧的前向概率;以及语音识别单元,用于计算各个HMM的前向概率直到最后一帧,然后提供分配给对于最后一帧提供最大前向概率的HMM的类型作为语音识别的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710127193.7/,转载请声明来源钻瓜专利网。