[发明专利]采用多个文法网络的语音识别系统无效

专利信息
申请号: 98120847.9 申请日: 1998-09-29
公开(公告)号: CN1249480A 公开(公告)日: 2000-04-05
发明(设计)人: 迈克尔·盖勒;让-克劳德·琼奎 申请(专利权)人: 松下电器产业株式会社
主分类号: G06F17/40 分类号: G06F17/40;G06F17/28
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 杨国旭
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 采用 文法 网络 语音 识别 系统
【说明书】:

发明一般涉及计算机实现的语音识别。更具体地,本发明涉及采用多个文法网络处理语音数据的方法及装置。采用多个网络得出语音数据的不同分节,以便从无用的语音中抽取有用的语音。

虽然本发明有许多用处,这里所描述的为适用于电话呼叫路由选择应用的类型的拼读姓名识别系统。在示出的实施例中,利用第一与第二文法网络来独立检测N最佳与M最佳字母序列。一种文法网络是配置在用户将响应系统提示立即开始拼读的假设之上的。第二种文法网络是配置在拼读的姓名字母序列是以系统不能识别的外来噪音或发音开始的假设之上的。将N最佳与M最佳字母序列分开提交给相对于有效姓名的词典的动态编程匹配,以抽取对应于各N最佳与M最佳字母序列的N最佳与M最佳姓名假设。然后通过从这些姓名假设集合中选择最佳候选姓名而作出识别决定。

当前的语音识别技术包含声音数据中的模式识别及这些模式与系统所识别的预定词典项集合的关联。语音识别问题是极具挑战性的,因为存在着如此之多的不同差异。通常,语音识别器以数字格式将进入的声音数据作用在数学识别进程上,后者根据预定的模型将数字数据转换成参数。

传统上,模型是早先已用充分大的训练集合训练过的,从而极大地降低了单个说话者的差异。基于模型的识别进程将进入的数据分节成诸如音素等基础分量,然后通过与训练模型比较加上标记。在一种形式的识别器中,一旦在单个音素上加上了标记,便将该音素数据与系统词典中预存储的字比较。这一比较是通过对准进程执行的,由于不准确的音素识别以及在给定的序列中插入与删除音素而对准进程会提供不精确的匹配。这一系统是在概率基础上工作的。传统上,语音识别器将从上分节、加标记与对准进程中得出的候选字中选择最可能的字。

由于它们的最基本的本质,当前的语音识别器从预定的词典中选择候选字,从而它们只识别预定的字的集合,这产生问题,特别是在根据语音识别结果作出进一步决定的系统中。在词典中找不到的外来噪音或字的发音通常被错误地解释成在词典中能找到的字。基于这种错误识别的后续决定能导致有故障的系统性能。

为了说明这一问题,考虑拼读姓名的电话呼叫路由选择应用。用合成的话音提示来指示用户拼读应将呼叫的路由确定到他的人的姓名。如果用户遵照这些指令,语音识别器识别所发出的各字母然后便能通过将字母序列与词典对准而查找拼读出的姓名。然后系统利用在词典中找到的路由信息将呼叫的路由确定到适当的分机上。然而,如果用户首先发出外加的信息,诸如在拼读之前读出该人的姓名,识别进程高度有可能失败。这是因为识别系统期望只接收一序列发音的字母而将试图作为一个或多个字母来“识别”讲出的姓名。传统的系统简单地未装设正确地分节进入的声音数据,因为系统建立在其上面的基础模型假设数据为对系统有用或有意义的全部等价单元(说出的字母)这一先验事实。

本发明解决上述问题的方法是通过采用与综合多个文法网络来生成多组识别候选字,某些基于假设存在外加语音的模型而某些则基于不存在外加语音的模型的语音识别系统。利用两种模型的结果来作出最终识别决定,依赖各自的匹配概率值来选择最可能的候选字。

按照本发明的一个方面,使用不同的第一与第二文法网络分开处理语音数据得出语音数据的不同分节。以这一方法,系统从无用的语音中抽取有用的语音。对于各文法网络,生成多个识别候选字。转佳实施例用第一文法网络生成N最佳候选字并用第二文法网络生成M最佳候选字,其中N与M为大于1的整数并可相等。第一与第二多个识别候选字(N最佳、M最佳)是根据至少一组关于有用的语音的先验制约变换的。变换可包括,诸如,将候选字与系统所识别的拼读姓名的词典匹配。然后根据经过变换的识别候选字作出识别决定。

如下面将更全面地说明的,本发明将语音数据分裂成各不相同地处理的两条或更多路径。一条路径是采用根据只提供有用的发音(如字母)的假设的第一文法网络处理的。另一条路径是用假定在有用语音之前存在外加的无用语音的不同文法网络处理的。从而不同的文法网络得出不同的数据分节。

各路径所生成的识别候选字可根据各候选字与各自的模型的匹配程度分别评分。不是为了选择带最高分的单一候选字而要求两条路径在这一阶段上进行竞争,而是将两组识别候选字保持分开。在这一阶段,识别候选字表示N最佳及M最佳字母序列假设。为了选择哪一种假设为最佳候选字,分开将两组与系统所识别的所有姓名的词典匹配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/98120847.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top