[发明专利]一种汉语语音识别可信度特征值的计算方法有效

申请号：	200810225353.6	申请日：	2008-10-31
公开（公告）号：	CN101393739A	公开（公告）日：	2009-03-25
发明（设计）人：	郑方;刘轶;曹文晓;赤羽诚;陈如新;高桥良知	申请（专利权）人：	清华大学;索尼电脑娱乐公司
主分类号：	G10L15/02	分类号：	G10L15/02
代理公司：	北京清亦华知识产权代理事务所	代理人：	罗文群
地址：	1000***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种计算机语音识别可信度特征值的计算方法，属于计算机语音识别技术领域。首先记录标识每帧语音最佳候选隐马尔可夫模型的三音子并构成原始三音子序列，记录标识语音识别结果的识别三音子序列；针对识别三音子序列，统计这样的三音子的个数，根据其时间对准信息从原始三音子序列中获取的对应的子序列不包含与该三音子中心基元相同的三音子，识别三音子序列中统计的这种三音子的个数，即为特征值。本发明方法仅需要记录每帧语音识别的最佳隐马尔可夫模型，并根据识别三音子序列进行比对，计算量小，计算速度快。本发明方法实现简单，可用于任何语音模型的语音识别系统，具有很好的语音识别拒识效果。
搜索关键词：	一种汉语语音识别可信度特征值计算方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1、一种计算机语音识别可信度特征值的计算方法，其特征在于该方法包括以下各步骤：(1)记录标识每帧语音的最佳候选隐马尔可夫模型的三音子，将三音子构成一个原始三音子序列，表示为：H＝{h_i，i＝1，2，...，s}，其中i为语音帧的序号，s为被识别语音的总帧数；(2)将语音识别结果的可信度特征值设为零，记录标识语音识别结果的识别三音子序列，表示为：R＝{r_j，j＝1，2，...，n}，其中j为识别三音子序列中的三音子序号，n为识别三音子序列中三音子的个数；(3)根据上述识别三音子序列，获取与序列中每个三音子相对应的起始语音帧的序号和结束语音帧的序号，并将起始帧和结束帧的帧序号分别表示为(4)根据上述三音子r_i的起始帧号和结束帧号，从上述原始三音子序列中获取与三音子r_i相对应的子序列，依次将子序列中的所有三音子的中心基元与识别三音子序列中的三音子r_i的中心基元进行比较，若子序列中所有三音子的中心基元都与三音子r_i的中心基元不相等，则上述可信度特征值加1；(5)重复步骤(4)，直至遍历识别三音子序列中所有三音子，得到可信度特征值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学;索尼电脑娱乐公司，未经清华大学;索尼电脑娱乐公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200810225353.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种汉语语音识别可信度特征值的计算方法有效

专利文献下载