[其他]一种语音特征的提取和识别方法无效

申请号：	85100083	申请日：	1985-04-01
公开（公告）号：	CN85100083A	公开（公告）日：	1986-08-06
发明（设计）人：	黄顺珍;蔡莲红	申请（专利权）人：	清华大学
主分类号：	G10L5/06	分类号：	G10L5/06
代理公司：	清华大学专利事务所	代理人：	王久春
地址：	北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音特征提取识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本方法属于模式识别技术范围。

利用通用频谱分析仪对语言进行频谱分析，并进行识别，其系统价格昂贵，识别率不高。如俞铁成，通用实时语音识别系统-RTSRS（01），物理学报，1978，No.5。清华大学计算机工程与科学系语音识别科研组，应用微处理机识别语音，清华大学学报，第21卷，第3期，1981年。

本发明提出一种有效地压缩语谱数据的方法，以推动语音输入的应用。

本方法具有如下特点：①识别率高，利用本方法对0-9十个数字的自然发音（非电报发音）进行识别，连呼1200次，识别结果错2次，识别率达99.8%;对牡丹江-北京-广州128个快车站各进行识别（无挑选）连呼1152次，错26次，识别率达97.7%。②每单词语音特征所占内存少，仅24字节。③方法简单，可在一般微处理机上移植本方法。

语音特征的提取和识别方法如图1所示。各部分简述如下：

①提取原始语谱矩阵

语音信息经频谱分析仪做予处理后送给计算机，软件以10ms周期对语音信息采样，并且自动判定语音开始和结束：当连续采得10组高于门槛的数据，即认为语音开始。当连续采得10组低于门槛的数据，即判定语音结束。

一旦判定语音开始，就将采得的一组16个数据做为矩阵的第一行，16个数据对应240Hz-6500Hz的16个频道，第二次采得的数据做为矩阵的第二行，语音结束前得到N行，构成N×16原始语谱矩阵A：

②数据处理与特征抽取

通过非线性分块，将时间规划成m块，对孤立调汇，常取m＝6，即规划成6块。信息变化激烈的部分该块取组数少一些，反之则取组数多一些，用以反映语音变化缓急情况的是矩阵D：

d_H＝Σj = 116]]>｜a_H，j-a_H+1，j｜

d_H大者，说明以H时刻到H+1时刻语谱变化激烈，反之则变化缓慢。以下式为分块尺度（分六块时）：

△D＝ 1/6ΣH = 1N - 1]]>d_H

满足下式时第一块从第一行到P₁行：

ΣH = 1P 1- 1]]>d_H+ 1/2 dP₁＜△D≤ΣH = 1P 1]]>+ 1/2 dP₁+1