[发明专利]连续语音识别无效
申请号: | 94191651.0 | 申请日: | 1994-03-31 |
公开(公告)号: | CN1058097C | 公开(公告)日: | 2000-11-01 |
发明(设计)人: | 塞缪尔·加文·史密斯;西蒙·帕特里克·亚历山大·林兰 | 申请(专利权)人: | 英国电讯有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 蹇炜 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连续 语音 识别 | ||
本发明涉及连续语音识别并且具体地涉及用于将文法约束应用在连续语音识别上的方法与装置。本发明在任务约束的连续单词识别领域内特别受到关注,其中的任务可以是诸如识别一组帐号或产品码中之一。
在语音识别处理中通常将数字形式的语音数据输入到所谓的前端处理器中,该处理器从输入语音数据流中导出称作前端特征集或矢量的一组更紧致、感觉上有意义的数据组。例如,通常通过麦克风输入语音,抽样、数字化、切分成长度为10-20ms的帧(诸如在8kHz上抽样),以及为各帧计算一组系数。在语音识别中,通常假定发言者说出一组单词或短语之一。称作样板或模型的单词或短语的一种存储的表示包括该字的一个对比特征矩阵,在发言者无关识别的情况中是事先从多名发言者提取的。将输入的特征矢量与模型匹配,从中产生两者之间的相似性的一个测度。
语音识别(无论人类或机器)是容易产生错误及可能得出单词的误识别的。如果不正确地识别了一个单词或短语,语音识别器可提供另一次识别尝试,它可以是正确的也可以是不正确的。
已经提出过各种处理语音来选择输入语音与存储的语音样板或模型之间的最佳备选匹配的方法。在孤立单词识别系统中,备选匹配的产生是相当简单明了的:各单词是在表示要识别的单词的一个转移网络中的一条独立“路径”,这些独立的单词路径只在网络中的终点上连接。按照它们对存储的样板之类的相似性将离开网络的所有路径排序可以给出最佳及备选的匹配。
然而,在大多数连续识别系统及某些基于连续识别技术的孤立单词识别系统中,并不总是可能在该网络的终点上重新组合所有的路径的,因此,从网络的出口点上所能得到的信息中即不可能直接得出最佳的也不可能得出备选的匹配。在S.J.Young,N.H.Russell与J.H.S.Thornton)的“令牌传递:连续语音识别系统的一种简单概念模型”(剑桥大学工程系,1989)中讨论了产生最佳匹配问题的一种解法,其中涉及到通过设计成表示期望的输入语音的一个转移网络传递称作令牌的信息包。通用术语“网络”包括有向非循环图(DAG)与树。一个DAG是没有环的一个网络,而一棵树则是路径的唯一交汇点在概念上直接出现在网络的终点上的一个网络。一个令牌包含有关通过的部分路径以及表示输入语音与直到此时为止处理过的网络部分之间的相似程度的累计得分的信息。
如young等人所描述的,在每次将一帧语音输入到一个转移网络时,便将存在于一个节点的输入端上的任何令牌传递进该节点并将当前语音帧在与这些节点相关的单词模型内进行匹配。在各节点的输出端上,发出带有更新后的部分路径信息及得分的一个令牌(该令牌已“行进”通过与该节点相关联的模型)。如果提交给一个节点的有一个以上的令牌,只有最佳得分的令牌通过网络向前传播。当已经(由诸如暂停检测器等外部设备)发信号通知语音结束时,将在最终节点上出现一个第一令牌。从该令牌中能够通过利用包含在令牌内的部分路径信息沿路径回溯而提取通过网络的整个路径,以提供对输入语音的最佳匹配。
有可能构造一个枚举所有的单词序列的一个网络,多半是以树的形式。虽然这是相对简单明了地构成的,但随着识别任务大小的增长而变得成问题了。例如,表示250,000个7位序列的一个树网络可能有一百万个节点。如果每一个节点占用50个字节的存储器,该网络将占用50兆字节。虽然这一网络的计算需要量能够通过在任一时刻上只维持它的一小部分活跃而加以抑制,但存储网络的拓扑所需的存储量保持不变。另一种选择是在需要时动态地建立网络,但这本身将强加可观的计算负担。
本发明目的在于提供一种新的用于将文法约束应用在连续语音识别上的方法与装置。
按照本发明提供了一种语音识别器,包括:
用于构成所期望的输入语音的模型的一个网络,该网络具有多个用于处理输入语音的词汇节点,各词汇节点至少与一个单词表示模型相关联,该模型的操作为生成一个指示输入语音与认为识别了的语音之间的相似程度的第一参数;
用于比较来自不同单词表示模型的第一参数的比较装置,并且根据这一比较用于确定要通过网络传播的参数;以及
用于在网络的一个输出端上确定具有最高相似程度的参数及认为识别了的输入语音的装置;
其特征在于提供了用于将一个标记分配给至少一个词汇节点的装置;
在于提供了用于将各第一参数与一个表示通过该网络的一条路径的累积标记的一个第二参数相关联的装置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英国电讯有限公司,未经英国电讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94191651.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:发卡
- 下一篇:MIS半导体器件的制造方法