[发明专利]一种基于语音分段的孤立词识别方法有效

申请号：	201010110518.2	申请日：	2010-02-09
公开（公告）号：	CN101819772A	公开（公告）日：	2010-09-01
发明（设计）人：	廖广锐;刘萍;汤磊	申请（专利权）人：	中国船舶重工集团公司第七○九研究所
主分类号：	G10L15/14	分类号：	G10L15/14
代理公司：	武汉金堂专利事务所 42212	代理人：	胡清堂
地址：	430074 湖北省武汉市珞喻***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音分段孤立识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及自动语音识别技术领域，具体的说是一种基于语音分段的孤立词识别方法。

背景技术

目前所用到的非特定人孤立词语音识别方法都是基于隐马尔可夫模型 (Hidden Markov Model，HMM)，在语音识别过程中，将待识语音的所有特征参数与词表内所有孤立词的HMM作匹配处理，计算出最大的概率值作识别结果。

传统的非特定人孤立词语音识别方法是顺序的计算出待识语音特征参数停留在每个孤立词中最后一个音节或半音节(即最后一个状态)的输出概率，将概率最大的孤立词作为识别结果。这种一次性计算出待识语音对该孤立词的总概率的方法，不可避免错误的识别出来一些与待识语音总体特征相似的孤立词。

发明内容

本发明的目的是研制一种能有效地解决现有孤立词语音识别方法中的缺陷、语音识别性能高、识别响应时间短的基于语音分段的孤立词识别方法。

本发明一种基于语音分段的孤立词识别方法，其语音训练所得的连续HMM 模型是以音节或半音节作为基元，将已训练好的基元模型按照词表内孤立词的音节或半音节序列拼接得到整词模型，识别时采用Viterbi算法；

其具体步骤如下：

(1)将词表中所有孤立词的每个音节或半音节分开作为识别单元；

(2)记录连续n帧待识语音特征参数停留在每个孤立词的第一个音节或半音节末尾状态的平均概率，拒识其概率值小于指定阈值的孤立词，选出那些概率值比较大的孤立词作为下一次的匹配对象；具体的说，根据待识语音的特征参数，计算出第n1帧待识语音停留在词表中第一个孤立词的第一个音节或半音节末尾状态的最大概率值P₁₁，并且该最大概率值既大于待识语音停留在前一状态的最大概率值也大于待识语音停留在后一状态的最大概率值，P₁₁为计算完对数的概率值，再判断后面的连续Δn1-1帧停留在第一个孤立词的第一个音节或半音节末尾状态是否也是最大概率及其概率值P_1i，其中1＜i＜Δ n1+1，其平均概率值按如下公式①计算：

P1‾=(Σi=1Δn1(P1i/(n1+i)))/Δn1]]>①

P_1i代表从第n1帧起第i帧数据停留在第一个孤立词的第一个音节或半音节的最大概率；

(3)依次类推，计算待识语音其它的帧停留在词表内未拒识的每个孤立词第二、第三……倒数第二个音节或半音节的平均概率，并依次拒识掉部分概率值比较小的孤立词；具体的说，计算待识语音第n2帧并连续Δn2帧停留在词表中第一个孤立词的第二个音节或半音节末尾状态的平均概率其计算方法与计算公式与①式类似：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七○九研究所，未经中国船舶重工集团公司第七○九研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010110518.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语音分段的孤立词识别方法有效

专利文献下载