[其他]一种语音特征的提取和识别方法无效
申请号: | 85100083 | 申请日: | 1985-04-01 |
公开(公告)号: | CN85100083A | 公开(公告)日: | 1986-08-06 |
发明(设计)人: | 黄顺珍;蔡莲红 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L5/06 | 分类号: | G10L5/06 |
代理公司: | 清华大学专利事务所 | 代理人: | 王久春 |
地址: | 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 特征 提取 识别 方法 | ||
本方法属于模式识别技术范围。
利用通用频谱分析仪对语言进行频谱分析,并进行识别,其系统价格昂贵,识别率不高。如俞铁成,通用实时语音识别系统-RTSRS(01),物理学报,1978,No.5。清华大学计算机工程与科学系语音识别科研组,应用微处理机识别语音,清华大学学报,第21卷,第3期,1981年。
本发明提出一种有效地压缩语谱数据的方法,以推动语音输入的应用。
本方法具有如下特点:①识别率高,利用本方法对0-9十个数字的自然发音(非电报发音)进行识别,连呼1200次,识别结果错2次,识别率达99.8%;对牡丹江-北京-广州128个快车站各进行识别(无挑选)连呼1152次,错26次,识别率达97.7%。②每单词语音特征所占内存少,仅24字节。③方法简单,可在一般微处理机上移植本方法。
语音特征的提取和识别方法如图1所示。各部分简述如下:
①提取原始语谱矩阵
语音信息经频谱分析仪做予处理后送给计算机,软件以10ms周期对语音信息采样,并且自动判定语音开始和结束:当连续采得10组高于门槛的数据,即认为语音开始。当连续采得10组低于门槛的数据,即判定语音结束。
一旦判定语音开始,就将采得的一组16个数据做为矩阵的第一行,16个数据对应240Hz-6500Hz的16个频道,第二次采得的数据做为矩阵的第二行,语音结束前得到N行,构成N×16原始语谱矩阵A:
②数据处理与特征抽取
通过非线性分块,将时间规划成m块,对孤立调汇,常取m=6,即规划成6块。信息变化激烈的部分该块取组数少一些,反之则取组数多一些,用以反映语音变化缓急情况的是矩阵D:
dH=
dH大者,说明以H时刻到H+1时刻语谱变化激烈,反之则变化缓慢。以下式为分块尺度(分六块时):
△D= 1/6
满足下式时第一块从第一行到P1行:
满足下式时,第二块从P1+1行到P2行
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/85100083/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电磁式仪用直流直线电动机
- 下一篇:用影象云纹检测光学元件性能的方法