[发明专利]一种构音识别方法及其系统在审

申请号：	201410353819.6	申请日：	2014-07-23
公开（公告）号：	CN104123934A	公开（公告）日：	2014-10-29
发明（设计）人：	黄昭鸣;周林灿;李宁	申请（专利权）人：	泰亿格电子（上海）有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/02
代理公司：	上海麦其知识产权代理事务所(普通合伙) 31257	代理人：	董红曼
地址：	201611 上海***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种识别方法及其系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及言语识别，尤其设计一种构音识别方法及其系统。

背景技术

构音是言语产生的基础，通过构音器官(如，下颌、唇、舌、软腭等)的协调运动产生。构音运动产生的最小语音单位是音素，语音学定义了音素包括元音和辅音两类。汉语普通话的构音识别结果包括两部分：音素组合成的音节和声调。但是目前构音识别技术无法准确识别由相同音节不同声调组成的字音，而且并非以音素为单位进行识别，导致识别结果并不适用于言语语言教育。

为了克服现有技术中的无法准确识别语音中的内容无法准确识别由相同音节不同声调组成的字音，而且并非以音素为单位进行识别，导致识别结果并不适用于言语语言教育的缺陷，提出了一种构音识别方法及其系统。

发明内容

本发明提出了一种构音识别方法，包括如下步骤：获取样本信号，对所述样本信号进行滤波去噪后，将所述样本信号通过A/D转换量化为二进制的样本信号，从所述二进制的样本信号中提取包含语音的语音信号；提取所述语音信号中的声学特征参数，所述声学特征参数用于识别音节和音调；选定与训练声学模型，分别计算各个所述声学特征参数在隐马尔可夫模型下的最大似然概率值，得到对应于所述最大似然值的最优模型参数；构音识别，采集待识别信号，根据所述最优模型参数计算所述待识别信号的各个声学特征参数的概率值，得到识别结果。

本发明提出的所述构音识别方法中，提取包含语音的语音信号的步骤包括：将所述二进制的样本信号截取为多个帧；计算至少一帧的短时自相关函数的平均值；根据所述平均值计算用于判断当前帧的短时过门限率；根据所述短时过门限率判断所述当前帧是清音或浊音；逐个判断所有帧，直至获得起始帧与终止帧时得到语音信号。

本发明提出的所述构音识别方法中，所述短时自相关函数为：

R^n(k)=Σm=0N-1xn(m)x′n(m+k);]]>