[发明专利]分段和识别语音信号的系统和方法无效
申请号: | 99815323.0 | 申请日: | 1999-12-29 |
公开(公告)号: | CN1348580A | 公开(公告)日: | 2002-05-08 |
发明(设计)人: | 毕宁;张承纯 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04 |
代理公司: | 上海专利商标事务所 | 代理人: | 李湘 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分段 识别 语音 信号 系统 方法 | ||
发明领域
本发明通常涉及语音识别。本发明特别涉及用于语音识别目的的语音信号分段系统和方法。
背景技术
模式识别技术已经被广泛用于语音识别。这种技术中的基本思想是将输入语音模式与一组模板比较,每个模板代表词汇表中预先录制的语音模式。识别结果为词汇表中的单词,该单词与最为类似于输入语音模式的语音模式的模板相关。
要听懂话音,通常无需听出话音(例如单词)中的所有细节。这表明语音内存在一些固有的冗余。已经研发出许多利用这种冗余的语音识别技术。例如授予Yu等人的美国专利No.5,056,150揭示了一种实时语音识别系统,其中采用非线性时间归一化方法,通过只保存具有明显时间动态属性的频谱将语音模式归一化为预先确定的长度。利用该方法,虽然可能偶尔会重复保存相同的频谱,但是明显压缩了语音模式。
另一种语音识别技术采用代表频谱帧序列的声学段序列。段是语音识别依赖的基本语音单位。一种生成声学段或完成分段的程序是利用动态规划方法搜索频谱序列中最可能发生的断点。这些选定点被用作段边界。参见J.Cohen的“利用动态规划对语音进行分段”,J.Acoustic Soc.of Americ,May 1981,Vol.69(5),pp.1430-1437。该技术与上述美国专利No.5,056,150一样,基于在语音模式中对明显的时间动态属性的搜索。
另一种用来对语音进行分段的技术基于分段K平均训练过程。参见L.R.Rabiner等人的“连接单词识别的分段K平均训练过程”,AT&T TechnicalJournal,May/June 1986 Vol.65(3),pp.21-31。利用迭代训练过程,话音被分段为单词或亚单词单元。每个单元随后被用作语音识别系统内的语音模板。迭代训练过程需要多个计算步骤,因此无法实时实现。
这些问题和缺陷由本发明以下述方式识别和解决。
发明内容
本发明针对一种从具有多个帧的输入语音信号形成得到语音信号的系统和方法。分段语音信号提供了语音识别所基于的模板。首先,输入语音信号被转换为具有多个语音帧的频域信号,其中频域信号的每个语音帧至少用一个但是通常用多个与语音帧相关的频谱值表示。频谱值通常选定为封装语音帧的声音内容。随后确定频域信号每对相邻帧的频谱差值。频谱差值表示相邻帧对频谱值之间的差值。频谱差值表示帧之间的时间动态属性。在频域信号内的每对相邻帧之间设定初始簇(cluster)边界,并且为频域信号内的每个单帧簇指定方差值,其中每个单帧簇的方差值等于相应的频谱差值。接着计算每对相邻簇的簇合并参数。簇合并参数根据相邻簇的频谱差值计算。最小的簇合并参数选自多个簇合并参数。最小合并参数表示最无意义的时间动态属性。随后的合并簇形成方式为取消与最小合并参数相关的簇之间的簇边界并且为合并簇指定一个合并方差值,其中合并方差值表示指定给与最小合并参数相关的簇的方差值。为了形成多个合并簇,重复该过程,并且根据多个合并簇形成分段语音信号。
附图简述
通过以下结合附图对本发明的描述将进一步理解本发明的特征、目标和优点,附图中相同的标号表示相同的部分,其中:
图1A和1B为流程图,示出了将时域输入语音信号转换为输出分段语音信号的操作方法。
图2为流程图,示出了保存多个语音模板的操作方法,其中每个保存的语音模板表示已知的语音话音。
图3为流程图,示出了从输入语音信号中识别话音的操作方法。
图4为曲线图,示出了频域信号和与示意性话音相关的最终的簇边界,该示意性的话音按照本发明作了处理。
图5为曲线图,示出了与图4中最后的合并簇相关的方差值。
图6为硬件框图,示出了实施图1-3所示语音信号分段和识别系统的系统。
实施发明的较佳方式
参见图1A和1B,示出了将时域输入语音信号转换为输出分段语音信号的操作方法100的流程图。如下所述,方法包括为了减少存储器容量和便于语音识别而对语音进行非线性分段的“时间簇化”算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99815323.0/2.html,转载请声明来源钻瓜专利网。