[其他]语音识别无效
申请号: | 86100298 | 申请日: | 1986-01-20 |
公开(公告)号: | CN86100298A | 公开(公告)日: | 1986-08-06 |
发明(设计)人: | 马修·伦宁;保罗·默梅尔斯坦;维谢瓦·纳思·古普达 | 申请(专利权)人: | 北方电信有限公司 |
主分类号: | G10L9/06 | 分类号: | G10L9/06;G10L9/04 |
代理公司: | 中国专利代理有限公司 | 代理人: | 匡少波 |
地址: | 加拿大魁北克省*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 | ||
本发明是关于语音识别方面的一项发明。
在已知的各种语音识别器中,语音一般经过脉冲编码调制(PCM)的格式编码后,再经过预处理,使之变换为一种与人类听觉系统领悟语音的方式有更为密切关系的样式。例如,可以将语音加以处理,给出滤波器组的各通道能量、倒谱、唛耳(mel)-频率倒谱或线性预测系数。将各个识别单元,如字语或音节,与一系列代表各有效单元的各基准样型音中的每一个样型音进行比较,判认最相匹配的那一个样型音为未知的单元,並在输出端送出相应于该样型音的单元标志。
虽然这类识别器对于一些应用来说是合适的,但是,由于在于某些应用方面,特别是在要求与说话人无关、进行电话交谈或具有大词汇量的应用方面,这类识别器会产生令人不能接受的差错率,因而效果並不完全令人满意。其原因据认为是普通的表示法並不足以准确地模仿人类听觉系统的响应特性。
根据本发明,用以识别语音的设备包括:
(ⅰ)用于将未知的语言发音表示为一个参数帧序列的装置,每一参数帧代表上述语音的一个相应的时间帧;
(ⅱ)用于提供许多基准样型音的装置,每一样型音包含有一个参数帧序列,並用与第一点提及的参数帧相同的各种参数予以表示。
第一点提及的一个参数帧序列(未知的)和第二点提及的一个参数帧序列(基准的)中的每一参数帧均包含一组一次参数和一组二次参数。每一个二次参数表示在相对应的各参数帧(即导出各不同时间帧的各参数帧)内各相应一次参数之间带符号的差数;以及
(ⅲ)用于将一个未知语言的参数帧序列与每个基准样型音相比较,並确定哪个基准样型音与之最相匹配的装置。
每一参数帧包含有一组根据所用的表示类型加以选定的参数,例如各滤波器组的各通道的能量、倒谱、唛耳-频率方式倒谱或线性预测系数。
所说的各不同时间帧的中心之间的时间差应优选为20ms至200ms,最好选为50ms左右。二次参数通常由前面和后面的一次参数导出,例如由±25ms或者±两帧的一次参数导出。
最好再引入一个表示幅度变化或听觉响度变化的分量,该分量既作为未知语音又作为基准样型音的一个二次参数。这样的响应分量通常不用于一次参数,因为绝对幅度或绝对响应对于区分各种字词语音是不起作用的。
因此,本发明一般来说包括用一组动态二次参数扩充增强的一组通常用以识别语音的一次短时间静态参数,其中一次参数用于语音识别,其中二次参数表示每个一次参数在一段短的时间间隔(例如20至200ms)中的变化。除了一次参数之外,述采用动态二次参数,这正与其他诸如非相关性、听觉差别等参数相反,会使可用以区别讲话声音的距离测量或概率密度函数变得对语音差别更加灵敏。
任何一种短时间谱的表示都可以用作一组一次参数。这类表示的例子有滤波器组各通道能量、倒谱、唛耳-频率倒谱、线性预测系数等等。这些表示的每一种均是借助于少数的参数(一般取为3到80之间)在一个时间帧(一般为2到50ms)中估算音量大小或功率谱。
若Pt是在时间t时计算得到的各一次参数的矢量,则时间编移a和b应选为:
20ms≤a+b≤200ms
並且动态参数矢量△Pt定义为矢量差:
△Pt=Pt+a-Pt-b
本发明是利用各参数Pt与△Pt一起的合成效果表示时间t附近的语音信号。于是,概率密度函数和间距是利用同时包含静态(一次)和动态(二次)参数的这一扩增的参数组予以定义的。
另一方面上面的推导可以用帧数来表示。若△t=相邻帧间的时间差,並若Pi=第i帧内的一次参数矢量,则动态矢量△Pi可以定义为矢量差:
△Pi=Pi+〔a/△t〕-Pi-〔b/△t〕
选用的参数最好是唛耳频率方式的倒谱系数,在这种情况下,各一次参数C1……,Cn表示功率谱的形状而各二次参数△C1……,△Cn表示在规定时间间隔内的功率谱的形状的变化。此外,在这组二次参数中可以包含有△Co,用以表示响度或幅度的变化。
下面仅以一个例子,並参照附图,对本发明的一个实施方案进行描述,在附图中:
图1是一种语音识别器的一般原理方框图;
图2是表示该语音识别器的滤波器装置特性的图形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方电信有限公司,未经北方电信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/86100298/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光导纤维
- 下一篇:自适应恒定匀浆机强度控制系统