[其他]一种语音特征的提取和识别方法无效

专利信息
申请号: 85100083 申请日: 1985-04-01
公开(公告)号: CN85100083A 公开(公告)日: 1986-08-06
发明(设计)人: 黄顺珍;蔡莲红 申请(专利权)人: 清华大学
主分类号: G10L5/06 分类号: G10L5/06
代理公司: 清华大学专利事务所 代理人: 王久春
地址: 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 特征 提取 识别 方法
【说明书】:

本方法属于模式识别技术范围。

利用通用频谱分析仪对语言进行频谱分析,并进行识别,其系统价格昂贵,识别率不高。如俞铁成,通用实时语音识别系统-RTSRS(01),物理学报,1978,No.5。清华大学计算机工程与科学系语音识别科研组,应用微处理机识别语音,清华大学学报,第21卷,第3期,1981年。

发明提出一种有效地压缩语谱数据的方法,以推动语音输入的应用。

本方法具有如下特点:①识别率高,利用本方法对0-9十个数字的自然发音(非电报发音)进行识别,连呼1200次,识别结果错2次,识别率达99.8%;对牡丹江-北京-广州128个快车站各进行识别(无挑选)连呼1152次,错26次,识别率达97.7%。②每单词语音特征所占内存少,仅24字节。③方法简单,可在一般微处理机上移植本方法。

语音特征的提取和识别方法如图1所示。各部分简述如下:

①提取原始语谱矩阵

语音信息经频谱分析仪做予处理后送给计算机,软件以10ms周期对语音信息采样,并且自动判定语音开始和结束:当连续采得10组高于门槛的数据,即认为语音开始。当连续采得10组低于门槛的数据,即判定语音结束。

一旦判定语音开始,就将采得的一组16个数据做为矩阵的第一行,16个数据对应240Hz-6500Hz的16个频道,第二次采得的数据做为矩阵的第二行,语音结束前得到N行,构成N×16原始语谱矩阵A:

②数据处理与特征抽取

通过非线性分块,将时间规划成m块,对孤立调汇,常取m=6,即规划成6块。信息变化激烈的部分该块取组数少一些,反之则取组数多一些,用以反映语音变化缓急情况的是矩阵D:

dHΣj = 116]]>|aH,j-aH+1,j

dH大者,说明以H时刻到H+1时刻语谱变化激烈,反之则变化缓慢。以下式为分块尺度(分六块时):

△D= 1/6ΣH = 1N - 1]]>dH

满足下式时第一块从第一行到P1行:

ΣH = 1P 1- 1]]>dH+ 1/2 dP1<△D≤ΣH = 1P 1]]>+ 1/2 dP1+1

满足下式时,第二块从P1+1行到P2行

ΣH = 1P2- 1]]>+ 1/2 dP2<2·△D≤ΣH = 1P2]]>dH+ 1/2 dP2+1

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/85100083/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top