[发明专利]一种基于语音分段的孤立词识别方法有效
申请号: | 201010110518.2 | 申请日: | 2010-02-09 |
公开(公告)号: | CN101819772A | 公开(公告)日: | 2010-09-01 |
发明(设计)人: | 廖广锐;刘萍;汤磊 | 申请(专利权)人: | 中国船舶重工集团公司第七○九研究所 |
主分类号: | G10L15/14 | 分类号: | G10L15/14 |
代理公司: | 武汉金堂专利事务所 42212 | 代理人: | 胡清堂 |
地址: | 430074 湖北省武汉市珞喻*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 分段 孤立 识别 方法 | ||
技术领域
本发明涉及自动语音识别技术领域,具体的说是一种基于语音分段的孤 立词识别方法。
背景技术
目前所用到的非特定人孤立词语音识别方法都是基于隐马尔可夫模型 (Hidden Markov Model,HMM),在语音识别过程中,将待识语音的所有特征 参数与词表内所有孤立词的HMM作匹配处理,计算出最大的概率值作识别结 果。
传统的非特定人孤立词语音识别方法是顺序的计算出待识语音特征参数 停留在每个孤立词中最后一个音节或半音节(即最后一个状态)的输出概率, 将概率最大的孤立词作为识别结果。这种一次性计算出待识语音对该孤立词 的总概率的方法,不可避免错误的识别出来一些与待识语音总体特征相似的 孤立词。
发明内容
本发明的目的是研制一种能有效地解决现有孤立词语音识别方法中的缺 陷、语音识别性能高、识别响应时间短的基于语音分段的孤立词识别方法。
本发明一种基于语音分段的孤立词识别方法,其语音训练所得的连续HMM 模型是以音节或半音节作为基元,将已训练好的基元模型按照词表内孤立词 的音节或半音节序列拼接得到整词模型,识别时采用Viterbi算法;
其具体步骤如下:
(1)将词表中所有孤立词的每个音节或半音节分开作为识别单元;
(2)记录连续n帧待识语音特征参数停留在每个孤立词的第一个音节或半 音节末尾状态的平均概率,拒识其概率值小于指定阈值的孤立词,选出那些 概率值比较大的孤立词作为下一次的匹配对象;具体的说,根据待识语音的 特征参数,计算出第n1帧待识语音停留在词表中第一个孤立词的第一个音节 或半音节末尾状态的最大概率值P11,并且该最大概率值既大于待识语音停留 在前一状态的最大概率值也大于待识语音停留在后一状态的最大概率值,P11为计算完对数的概率值,再判断后面的连续Δn1-1帧停留在第一个孤立词的 第一个音节或半音节末尾状态是否也是最大概率及其概率值P1i,其中1<i<Δ n1+1,其平均概率值按如下公式①计算:
P1i代表从第n1帧起第i帧数据停留在第一个孤立词的第一个音节或半音 节的最大概率;
(3)依次类推,计算待识语音其它的帧停留在词表内未拒识的每个孤立词 第二、第三……倒数第二个音节或半音节的平均概率,并依次拒识掉部分概 率值比较小的孤立词;具体的说,计算待识语音第n2帧并连续Δn2帧停留在 词表中第一个孤立词的第二个音节或半音节末尾状态的平均概率其计算 方法与计算公式与①式类似:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七○九研究所,未经中国船舶重工集团公司第七○九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010110518.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:家庭用搅拌机
- 下一篇:纯蒸炉的水盒及纯蒸炉