[发明专利]模式分类中基于排序的丢弃无效
申请号: | 01801557.3 | 申请日: | 2001-04-26 |
公开(公告)号: | CN1381038A | 公开(公告)日: | 2002-11-20 |
发明(设计)人: | 威廉·M·坎贝尔;查尔斯·C·布朗 | 申请(专利权)人: | 摩托罗拉公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G06K9/62 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 付建军 |
地址: | 美国伊*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式 分类 基于 排序 丢弃 | ||
技术领域
本发明涉及模式分类,例如受训练系统中的语音识别。
更特别地,本发明涉及用于对不在分类中的输入进行丢弃的装置与方法。
背景技术
模式分类系统可以被用于两个典型的情形。一个封闭集合情形包括一个关于已知类别的固定集合。假设给出一个输入,分类器就被要求从这个类别列表中选择出最佳的选择。替代地,一个分类器可以被用于一个开集合的方式。关于开集合分类的一个一般情形是,这个分类器被提供了来自一单个类别的特征矢量。然后,这个分类器判断,这些特征是从前一个已知的类别还是从一个未知的类别中来的。开集合问题的一个应用是在语音识别中的非词汇表的丢弃。语音识别在这里被用作一个示例,因为语音识别是被广泛所知道的并且被广泛使用的,但是该领域内的技术人员应认识到,实际上,所有的模式识别系统是可以同样被应用的。在语音识别的示例中,识别器具有一个已知的词汇表;典型地,这个用户喜欢将一个不知道的单词标识为错误的识别。
使用一个语音识别系统作为一个典型的示例,假设在一个特定的示例中,这个系统在寻找一个“是”或者一个“否”的答案。在很多不同的情形下,这个用户可能会发出某些在词汇表中不存在的声音,例如”oh”,“ah”,“er”,或者这个用户可能会进行咳嗽或者清嗓子。典型地,这个语音识别系统仅看这个发音的成分,将它们与它正在寻找的单词,即是和否,的成分进行比较,并且使用一个阈值来判断这个发音是否足够地靠近需要被正确识别的单词中的一个。这里,问题是两个方面的。在很多情形下,这个发音可能是如此的靠近(例如,”oh”和”no”),它就被进行错误地分类。更为严重的问题是,在一个噪声系统中或者在一个噪声条件下,一个发音的很多部分可能被屏蔽或者丢失。这样,虽然该阈值是保持不变的,但是这个屏蔽(例如,噪声,所接收单词或者信号的靠近性,或者信号等等)会在不同的工作条件下而出现很大的变化。
因为缺少足够地对不在该类别中的输入进行丢弃,所以,从客户的可接受程度来说,目前的语音识别应用有很大的局限性。但是,对模式识别来说,判断规则中的丢弃选项不是一个新的领域。在30多年以前,在C.K.Chow写的一篇题为“On optimum recognition error and rejecttradeoff”,IEEE Trans.Inf.Theory”,IT-16,no.1,pp.41-46,1970年1月的论文中就引入了关于模式识别的最佳丢弃规则(Bayes丢弃规则)。然而,这个工作和其扩展与延伸工作,均假设我们已经非常确切地知道了类别统计特性。
在语音识别的情形下,对这个模式识别系统来说,仅可以获得一个类别统计特性的估计值。进一步,当这个输入语音被噪声破坏时,就产生了错误匹配的统计,初始的可能性分布估计值就不再是对实际分布的一个好的近似。这样,在寂静的条件下的最佳Bayes丢弃规则就不再有效。
近年来,关于改进非词汇单词的丢弃规则的工作集中在在类别内的模型分数,和垃圾,或者填充料模型与不在类别特征空间中的模型之间的可能性比例上。例如见:C.S.Ramalingam等等,“Speaker-dependentname dialing in a car environment with out-of-vocabulary rejection”,Proc.ICASSP,PP.165-168,1999;A.Bayya,“Rejection in speechrecognition system with limited training”,Proc.ICSLP,1998;H.Boulard,B.D’hoore and J.M.Boite,“Optimizing recognition and rejectionperformance in wordspotting system”,Proc.ICASSP,PP.I-373-I.376,1994;和R.C.Rose and D.B.Paul,“A hidden Markov model basedkeyword recognition system”,Proc.ICASSP,PP.129-132,1990。但是,一个基于分数的阈值仍然被使用,以根据某些成本函数而提供对识别和丢弃错误比例进行折衷的一个机制。使用这个阈值就会在阈值错误匹配的条件下导致很明显的性能下降。这是因为输入特征的统计特性发生了改变,导致分数范围进行了压缩。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于摩托罗拉公司,未经摩托罗拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01801557.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无线通信系统及使用该系统的通信终端装置
- 下一篇:车辆用灯具