[发明专利]以语音特征为基础的话语识别装置及方法无效
申请号: | 01124052.0 | 申请日: | 2001-08-08 |
公开(公告)号: | CN1400584A | 公开(公告)日: | 2003-03-05 |
发明(设计)人: | 卜令楷;阙志达 | 申请(专利权)人: | 韦尔博泰克公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 韩宏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 特征 基础 话语 识别 装置 方法 | ||
1、一种对以普通话中文的输入矢量进行话语识别的方法,包括有步骤:利用一组静态普通话元音作为语音特征参考元音。
2、根据权利要求1的方法,其中该组静态普通话元音具有九个组成部分。
3、根据权利要求2的方法,还包括有步骤:计算在该组静态普通话元音上的输入矢量的投射类似性。
4、根据权利要求3的方法,还包括有步骤:响应于该投射类似性计算的最高值,从该组静态普通话元音中选择一候选元音。
5、根据权利要求2的方法,还包括有步骤:计算在该组静态普通话元音上的输入矢量的相对投射类似性的步骤,语音特征映射是基于九个参考矢量。
6、根据权利要求5的方法,还包括有步骤:响应于该相对投射类似性计算的最高值,从该组静态普通话元音中选择一候选元音。
7、一种用于对以普通话中文的输入矢量进行话语识别的方法,包括有步骤:
(a)选择九个静态参考普通话元音用作为语音特征参考元音;
(b)计算在这些九个静态普通话元音上的输入矢量的投射类似性;
(c)计算在这些九个静态普通话元音上的输入矢量的相对投射类似性;
(d)从这些九个静态普通话元音中选择一组高投射类似性的元音;
(e)从该组高投射类似性元音中选择具有与输入矢量有最高相对投射类似性的静态普通话元音;及
(f)若该组高投射类似性元音为零,则响应于最高投射类似性计算,从这些九个静态参考普通话元音中选择一个元音
8、根据权利要求7的方法,还包括有步骤:利用一定标因子来控制相对投射交叉耦合的程度,从而增加一语音特征的识别力。
9、一种用于映射一输入话语频谱矢量的语音特征映射器,其包含有:
用于存储一组九个静态普通话参考频谱矢量的存储器;
处理装置,耦接至该存储装置,用于计算在这些九个静态普通话参考频谱矢量上的输入频谱矢量的投射类似性;与
选择装置,耦接至该处理装置,用于响应于由该处理装置所计算的最高投射类似性数值,选择这些九个静态普通话参考频谱矢量中的至少一个。
10、一种用于映射一输入话语频谱矢量的语音特征映射器,其包含有:
用于存储一组九个静态普通话参考频谱矢量的存储器;
处理装置,耦接至该存储装置,用于计算在这些九个静态普通话参考频谱矢量上的输入频谱矢量的相对投射类似性;及
选择装置,耦接至该处理装置,用于响应于由该处理装置所计算得的最高相对投射类似性值,选择这些九个静态普通话参考频谱矢量中的至少一个。
11、一种用于映射一输入话语频谱矢量的语音特征映射器,其包含有:
用于存储一组九个静态普通话参考频谱矢量的存储器;
处理装置,耦接至该存储装置,用于计算在这些九个静态普通话参考频谱矢量上的输入频谱矢量的投射类似性以及相对投射类似性;及
选择装置,耦接至该处理装置,用于响应于由该处理装置所计算得的投射类似性以及相对投射类似性值,选择这些九个静态普通话参考频谱矢量中的至少一个。
12、根据权利要求11的语音特征映射器,其中该处理装置还利用一定标因子来控制相对投射交叉耦合的程度,从而增加语音特征的识别力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韦尔博泰克公司,未经韦尔博泰克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01124052.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电热磁疗系列毯
- 下一篇:含非金刚石碳的合成金刚石半成品的纯化方法