[发明专利]分段和识别语音信号的系统和方法无效

申请号：	99815323.0	申请日：	1999-12-29
公开（公告）号：	CN1348580A	公开（公告）日：	2002-05-08
发明（设计）人：	毕宁;张承纯	申请（专利权）人：	高通股份有限公司
主分类号：	G10L15/04	分类号：	G10L15/04
代理公司：	上海专利商标事务所	代理人：	李湘
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种从具有多个帧的输入语音信号形成分段语音信号的系统和方法。输入语音信号从时域信号被转换为具有多个语音帧的频域信号,其中频域信号的每个语音帧至少用一个与语音帧相关的频谱值表示。确定频域信号每对相邻帧的频谱差值,其中每对相邻帧的频谱差值表示与相邻帧对的每帧相关的至少一个频谱值之间的差值。在频域信号内的每对相邻帧之间设定初始簇(cluster)边界,并且为频域信号内的每个单帧簇指定方差值,其中每个单帧簇的方差值等于相应的频谱差值。接着计算多个簇合并参数,其中每个簇合并参数与频域信号内相邻簇对相关。最小的簇合并参数选自多个簇合并参数。随后的合并簇形成方式为取消与最小合并参数相关的簇之间的簇边界并且为合并簇指定一个合并方差值,其中合并方差值表示指定给与最小合并参数相关的簇的方差值。为了形成多个合并簇,重复该过程,并且根据多个合并簇形成分段语音信号。
搜索关键词：	分段识别语音信号系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音识别系统内用于从包含多个帧的输入语音信号形成分段语音信号的方法，其特征在于包含以下步骤：将所述输入的语音信号从时域信号转换为包含多个语音帧的频域信号，其中所述频域信号中的每个语音帧用至少一个与所述语音帧相关的频谱值表示；在所述频域信号内的每对相邻帧之间指定初始簇边界以定义每个所述语音帧的簇；根据所述至少一个与每个簇内帧相关的频谱值为每个所述簇指定一个方差值；通过根据所述方差值取消相邻簇对之间的簇边界形成合并的簇；重复指定方差值和形成合并簇的步骤以形成多个合并的簇；以及根据所述多个合并簇形成所述分段语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于高通股份有限公司，未经高通股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/99815323.0/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]分段和识别语音信号的系统和方法无效

专利文献下载