[发明专利]分段和识别语音信号的系统和方法无效
申请号: | 99815323.0 | 申请日: | 1999-12-29 |
公开(公告)号: | CN1348580A | 公开(公告)日: | 2002-05-08 |
发明(设计)人: | 毕宁;张承纯 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04 |
代理公司: | 上海专利商标事务所 | 代理人: | 李湘 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分段 识别 语音 信号 系统 方法 | ||
1.一种语音识别系统内用于从包含多个帧的输入语音信号形成分段语音信号的方法,其特征在于包含以下步骤:
将所述输入的语音信号从时域信号转换为包含多个语音帧的频域信号,其中所述频域信号中的每个语音帧用至少一个与所述语音帧相关的频谱值表示;
在所述频域信号内的每对相邻帧之间指定初始簇边界以定义每个所述语音帧的簇;
根据所述至少一个与每个簇内帧相关的频谱值为每个所述簇指定一个方差值;
通过根据所述方差值取消相邻簇对之间的簇边界形成合并的簇;
重复指定方差值和形成合并簇的步骤以形成多个合并的簇;以及
根据所述多个合并簇形成所述分段语音信号。
2.如权利要求1所述的方法,其特征在于所述为每个簇指定方差值的步骤首先指定频谱差值的方差值,所述频谱差值表示所述至少一个与所述初始簇定义的每个簇的所述帧相关的频谱值之间的差值,并且随后指定方差值,它代表形成所述合并簇的相邻簇的方差值。
3.如权利要求2所述的方法,其特征在于通过对所述形成所述合并簇的相邻簇的所述方差值进行求和来确定所述随后指定的方差值。
4.如权利要求1所述的方法,其特征在于所述形成合并簇的步骤包含以下步骤:
计算多个簇合并参数,其中每个所述簇合并参数与一对相邻簇相关;
从所述多个簇合并参数选择最小簇合并参数;以及
通过取消与所述最小合并参数相关的所述相邻簇对之间的簇边界形成所述合并簇。
5.如权利要求1所述的方法,其特征在于所述重复步骤延续至已经形成预先确定数量的合并簇。
6.如权利要求1所述的方法,其特征在于所述频域信号内的每个语音帧(Fn)由多个值(Sn,j)表示并且每对相邻帧(Dn-1,n)的所述频谱差值确定如下:
7.如权利要求4所述的方法,其特征在于所述簇合并参数(CMP)的每一个根据所述方差值(Vi)和第一与第二权重因子(w1,w2)确定如下:
CMPi=w1*Vi+w2*(Vi+Vi-1),i=2,3,…,c
8.如权利要求1所述的方法,其特征在于所述形成所述分段语音信号的步骤进一步包括形成与所述多个合并簇的每一个相关的数值代表矢量Sirep。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99815323.0/1.html,转载请声明来源钻瓜专利网。