[发明专利]口语识别系统以及用于训练和操作该系统的方法有效
申请号: | 200580039161.0 | 申请日: | 2005-09-19 |
公开(公告)号: | CN101076851A | 公开(公告)日: | 2007-11-21 |
发明(设计)人: | 李海州;马斌;G·M·怀特 | 申请(专利权)人: | 新加坡科技研究局 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;李峥 |
地址: | 新加坡*** | 国省代码: | 新加坡;SG |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口语 识别 系统 以及 用于 训练 操作 方法 | ||
1.一种操作口语识别系统的方法,将未知语言识别为多种已知的候 选语言中的一种,所述方法包括如下步骤:
生成包括多个声音标记的声音目录,从所述已知的候选语言的子集提 供集体的多个声音标记;
提供多个训练样本,每个所述训练样本由一种所述已知的候选语言构 成;
从各个所述训练样本生成一个或多个训练向量,其中,每个所述训练 向量被定义为从所述已知候选语言的子集提供的所述多个声音标记的函 数;以及
将各个所述训练向量与相对应的所述训练样本的候选语言相关联;
从未知语言样本生成未知语言向量,所述未知语言向量被定义为从所 述已知候选语言的子集提供的所述多个声音标记的函数;以及 将所述未知语言向量与多个所述训练向量相关;
其中,将与所述未知语言向量最相关的训练向量所相关联的语言识别 为所述未知语言样本的语言;
其中,生成一个或多个训练向量包括生成对应于一种候选语言的多个 训练向量,所述方法进一步包括:从与所述候选语言相关联的所述多个训 练向量构造统计模型;
其中使用所述多个训练向量的算术平均值来形成均值训练向量,所述 均值训练向量形成统计模型λn的基础,该统计模型被用于确定在所述均值 训练向量和与未知语言样本相关联的未知语言向量之间的相关性。
2.根据权利要求1所述的方法,其中,所述声音目录包括V个所述 声音标记,所述训练向量包括在声音标记序列中的声音标记 的计数,其中n是候选语言指数,L是该声音标记序列的长度,其中,所 述声音标记的计数包括其中v被定义为所述声音目录中的第v个声音 标记,且被定义为所述声音标记序列中的所述第v个声音 标记的出现次数除以所有声音标记的总出现次数:
3.根据权利要求1所述的方法,其中,所述声音目录包括V个声音 标记,所述训练向量包括在声音标记序列中的声音标记对的 计数,其中n是候选语言指数,L是该声音标记序列的长度,其中,所述 声音标记对的计数包括其中,被定义为在所述声音标记序列 中的声音标记对的出现次数除以所有声音标记对{vjvk}的总 出现次数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新加坡科技研究局,未经新加坡科技研究局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580039161.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汇款电子自助系统
- 下一篇:一种从提金尾渣中浮选硫精矿的方法