[发明专利]语音处理无效

专利信息
申请号: 94191652.9 申请日: 1994-03-31
公开(公告)号: CN1120372A 公开(公告)日: 1996-04-10
发明(设计)人: 塞缪尔·加文·史密斯 申请(专利权)人: 英国电讯有限公司
主分类号: G10L5/06 分类号: G10L5/06
代理公司: 永新专利商标代理有限公司 代理人: 蹇炜
地址: 英国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 处理
【说明书】:

发明涉及语音处理,更具体地涉及用于处理连续语音的备选句法分析的系统。

语音处理包括发言者识别,在其中检测或验证发言者的身份;以及语音识别,在其中任何人都能使用一个系统而无需经过识别器培训;以及所谓发言者相关的识别,在其中允许操作一个系统的用户是受限制的并且需要一个培训阶段来从各允许的用户得到信息,在识别处理中通常以数字形式将语音数据输入到一个所谓的前端处理器中,它从输入语音数据流中导出称作前端特征集或矢量的一组更紧致、感性上更有意义的数据。例如,语音通常经由麦克风输入,抽样,数字化,切分成长度为10-20ms的帧(诸如在8KHz上抽样),以及为每一帧计算一组系数。在语音识别中,通常假定发言者说出一组已知的单词或短语中的一个。称作样板或模型的单词或短语的一种存储的表示包括在发言者无关识别的情况中事先从多个发言者取得的该单词的一个基准特征矩阵。将输入特征矢量与模型对比并生成两者之间的一个相似性测度。

语音识别(无论是人类或机器)容易产生错误并且可能导致单词的错误识别。如果不正确地识别了一个单词或短语,则语音识别在识别中提供另一次尝试,这又可能是正确或不正确的。

已经提出过各种用于处理语音而选择输入语音与存储的语音样板或模型之间的最佳或备选的匹配的方法。在孤立的单词识别系统中,备选匹配的产生是相当简单明了的:各单词是一个表示要识别的单词的一个转移网络中的一条独立的‘路径’,并且独立的单词路径只在网络的终点上相连。将从网络出来的所有路径按它们与存储的样板之类的相似性排序便能给出最佳的与备选的匹配。

然而,在大多数连续识别系统及基于连续识别技术的某些孤立单词识别系统中,不总是有可能在网络的终点上重组所有的路径的,既不能从网络的出口点上得到的信息中直接得到最佳匹配也不能得到备选匹配。产生最佳匹配的问题的一种解决方法在1989年S.J.Young、N.H.Russell及J·H·S·Thornton的“令牌传递:连续语音识别系统的一种简单概念模型”中有所讨论,该文涉及通过一个转移网络传递称作令牌的信息包。一个令牌包含关于通过的部分路径的信息以及表示输入的与到此时为止处理过的网络部分之间的相似程度的一个累积得分。

如Young等人所描述的,在每次将一帧语音输入到一个转移网络时,便将出现在一个节点的输入端上的任何令牌传递进该节点中,并且在与这些节点相关联的单词模型内匹配当前的语音帧。然后新的令牌出现在节点的输出端上(已“行进”通过了与该节点相关联的模型)。这时只有最佳得分的令牌被传递到后面的节点的输入端上。当(诸如一个暂停检测器等外部设备)发出信号通知语音结束时,在最终节点上将出现一个单一的令牌。通过利用包含在令牌内的前面的路径信息沿该路径回溯,便能从这一令牌中提取通过网络的整个路径,而提供对输入语音的最佳匹配。

S.C.Austin与F.Fallside的论文“采用隐Markov模型的自动语音识别的一种统一的方向机制”(ICASSP 1989,卷1,667-670页)涉及以类似于上述Young等人所描述的方式操作的一种连续单词语音识别器。有关通过转移网络的识别进程的经历从单词模型出来时受到更新。识别结束时,识别结果是从提交给输出端的具有最佳得分的经历中得出的。对于每一条终止在最终节点上的路径,只有一种经历是可能的。

这种已知的配置并不允许在网络的输出端上容易地行到备用的选择。

按照本发明,一种用于识别输入连续语音的路径链路传递的语音识别系统包括:用于从一个输入语音信号导出识别特征数据的装置;处理装置,用于构成期望的输入语音的模型,及用于将识别特征数据与构成模型的期望输入语音进行比较,该处理装置具有多个与单词表示模型相关联的词汇节点;以及用于依靠比较结果指示输入语音信号的识别的装置,其特征在于至少一个词汇节点能够同时处理一条以上的路径链路。

这种配置表明在一个给定的时刻一个节点能够处理一条以上的进入路径链路,并从而可以得出一个以上的识别结果。

构成模型的装置最好包括一个具有多个噪声节点及与单词表示模型相关联的词汇节点的转移网络。这些节点能够生成路径链路,路径链路中包括:用于存储指向前一条路径链路的指针的字段;一条路径的累积得分;指向前一个节点的指针;以及用于切分信息的一个时标。最好,能够处理一条以上路径链路的词汇节点具有一个以上的相同的关联的单词表示模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英国电讯有限公司,未经英国电讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/94191652.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top