[发明专利]感知语音特征话语识别系统及方法无效
申请号: | 01124051.2 | 申请日: | 2001-08-08 |
公开(公告)号: | CN1400583A | 公开(公告)日: | 2003-03-05 |
发明(设计)人: | 卜令楷;阙志达 | 申请(专利权)人: | 韦尔博泰克公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L19/02 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 韩宏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 感知 语音 特征 话语 识别 系统 方法 | ||
1、一种用于处理输入话语频谱矢量的话语处理系统,其包含:
感知话语处理器,用于感知地处理输入话语频谱矢量以产生感知频谱;
存储装置,用于存储多个参考频谱矢量;以及
语音特征映射器,其与该感知话语处理器及该存储装置耦合,用于将该感知的频谱映射至该多个参考频谱矢量上。
2、根据权利要求1的话语处理系统,其中该感知话语处理器包含:
遮蔽操纵装置,用于噪音遮蔽输入话语频谱矢量以产生经遮蔽的输入话语频谱矢量;
最小可听见的区域曲线重正规化器,耦合至该遮蔽操纵装置,用于将对应至最小可听见的区域的该经遮蔽的输入话语频谱矢量重正规化,以产生重正规化的经遮蔽的输入话语频谱矢量,以及
美-标度再取样器,耦合至该最小可听见的区域曲线重正规化器,用于转换该重正规化的经遮蔽的输入话语频谱矢量成美-标度。
3、根据权利要求1的话语处理系统,其中该语音特征映射器包含:
投射类似性发生器,耦合至该存储装置,用于产生该输入频谱矢量到该多个参考频谱矢量上的多个投射类似性计算;
相对投射类似性发生器,耦合至该存储装置,用于产生该输入频谱矢量到该多个参考频谱矢量上的多个相对投射类似性计算;以及
选择器,耦合至该投射类似性发生器及该相对投射类似性发生器,用于自对应至该输入话语频谱矢量在该多个参考频谱矢量上的投射类似性及相对投射类似性的相对值的该投射类似性发生器计算及该相对投射类似性发生器计算之间选择一投射类似性。
4、根据权利要求3的话语处理系统,其中该多个参考频谱矢量是由多个静态元音组成。
5、根据权利要求4的话语处理系统,其中该多个静态元音是由9个静态的普通话元音组成。
6、一种用于识别一经取样的话语频谱矢量的话语识别系统,其包含:
快速傅立叶变换分析仪,用于产生经取样的话语频谱矢量的傅立叶变换,
感知话语处理器,耦合至该快速傅立叶变换分析仪,用于处理该傅立叶变换以产生感知频谱;
存储装置,用于存储多个参考频谱矢量;以及
语音特征映射器,其与该感知话语处理器及该存储装置耦合,用于将该感知频谱映射至该多个参考频谱矢量,从而选择至少一与该感知频谱有最大类似性的参考矢量;以及
连续HMM识别器,耦合至该语音特征映射器,用于识别该至少一个参考矢量。
7、根据权利要求6的话语识别系统,其中该多个参考频谱矢量是由多个静态元音组成。
8、根据权利要求7的话语识别系统,其中该多个静态元音是由9个静态的普通话元音组成。
9、一种用于处理一输入话语频谱矢量的话语处理方法,包含下述步骤:
感知地处理输入话语频谱矢量以产生感知频谱;
存储多个参考频谱矢量;以及
将该感知频谱映射至该多个参考频谱矢量上。
10、根据权利要求9的话语处理方法,其中该感知地处理步骤进一步包含下述步骤:
噪音遮蔽输入话语频谱矢量以产生经遮蔽的输入话语频谱矢量;
将对应至最小可听见的区域的该经遮蔽的输入话语频谱矢量重正规化,以产生重正规化的经遮蔽的输入话语频谱矢量,以及
转换该重正规化的经遮蔽的输入话语频谱矢量成美-标度。
11、根据权利要求9的话语处理方法,其中该映射步骤进一步包含下述步骤:
产生该输入频谱矢量到该多个参考频谱矢量上的多个投射类似性计算;
产生该输入频谱矢量到该多个参考频谱矢量上的多个相对投射类似性计算;以及
自对应至该输入话语频谱矢量在该多个参考频谱矢量上的投射类似性及相对投射类似性的相对值的该投射类似性发生器计算及该相对投射类似性发生器计算之间选择一投射类似性。
12、根据权利要求11的话语处理方法,其中该多个参考频谱矢量由多个静态元音组成。
13、根据权利要求12的话语处理方法,其中该多个静态元音由9个静态的普通话元音组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韦尔博泰克公司,未经韦尔博泰克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01124051.2/1.html,转载请声明来源钻瓜专利网。