[发明专利]一种模式分类模型由抽象到具体AtoC模型无效
申请号: | 201010197945.9 | 申请日: | 2010-06-10 |
公开(公告)号: | CN101944181A | 公开(公告)日: | 2011-01-12 |
发明(设计)人: | 顾晓东;王林路;汪源源 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模式 分类 模型 抽象 具体 atoc | ||
技术领域
本发明属于图像识别技术领域,具体涉及一种模式分类模型由抽象到具体AtoC模型,由抽象到具体AtoC(Abstract to Concrete)模型可以用于图像识别中,特别是类别较少的模式识别中,如表情识别、数字识别等问题。
背景技术
模式识别分类问题是指根据待识别对象所呈现的观察值将其分到某个类别中去。如何作出合理的判决就是模式识别分类器要讨论的问题。在统计模式识别中,感兴趣的主要问题并不是决策正误,而在于如何使决策错误造成的分类误差在整个识别过程的风险代价达到最小。模式识别算法的设计都是强调最佳与最优,即希望所设计的系统在性能上最优。在d维特征空间已经确定的前提下,讨论的分类器设计问题是一个选择什么准则,使用什么方法将已经确定的d维特征空间划分成决策域的问题。目前的分类器大概有模板匹配、Bayes分类,神经网络,SVM,Adaboost,HMM等
在哲学中一种观点,人类认识事物的过程是一个从抽象到具体的过程,头脑中有某个事物的积累和总结的抽象信息,然后才会对某个物体有具体的形状信息。在计算机领域,认为模式识别也可以利用这种方法,对某个物体分类从抽象到具体的、逐步的识别出来。在人脸表情识别中,AtoC能够取得非常的识别效果。
发明内容
本发明的目的在于提出一种能够有效地进行图像模式分类的由抽象到具体AtoC(Abstract to Concrete)的模型。
本发明解决模式分类所采用的技术方案是:AtoC模型尝试解决K类分类问题,每个输入向量属于1,2,3,...,K中的一个,AtoC模型依次包含多模块(记为MM<K>),MAX模块(记为MAXr),决策模块(记为DM),以及少模块(记为LM,共有个少分类器组成,并以LM的下标区分)。AtoC模型的输入是能够代表一个物体的特征向量,如几何特征,纹理特征,等其他的特征。输出就是这个物体该属于的某个类别。多模块MM<K>是抽象的分类模块,K是所有类的数量。MAX模块MAXr是指找出前r个最大的概率对应的类别。
MM<K>的输入是一个物体的特征信息,会得到K个概率。也就是这个物体可能被识别成K个类中的任何一个类,只是对应的概率是不一样的。从中找出前r个最大的概率对应的类别是哪几个。在DM中,通过一些决策规则决定这个输入向量是应该进一步送到LM中的哪一个少分类器中,还是直接给出具体的类别属性。共有个少分类器,每个少分类器都是一个r类的分类器,但都是不一样的分类器。例如,经过MM,选出了3个类别,这三个类别分别是2,4,5,他们对应的概率是分别最大的三个,类别2对应的概率最大,4其次,5对应的概率第三大。然后根据决策规则决定是直接输出这个物体的类别是2,还是需要送到LM模块的245少分类器中。
本发明的有益效果是能够有效的进行图像模式分类,特别是针对类别较少的模式分类问题,如人类六种基本表情识别、数字识别,英文字母识别等问题。
本发明所述的模式分类模型由抽象到具体AtoC模型,可以把SVM,神经网络(BP等网络)应用于AtoC模型中。
附图说明
下面结合附图对本发明进一步说明。
图1是本发明的英文图。
图2是本发明的中文图。
具体实施方式
MM<K>的输入是一个物体的特征信息,会得到K个概率。也就是这个物体可能被识别成K个类中的任何一个类,只是对应的概率是不一样的。从中找出前r个最大的概率对应的类别是哪几个。在DM中,通过一些决策规则决定这个输入向量是应该进一步送到LM中的哪一个少分类器中,还是直接给出具体的类别属性。共有个少分类器,每个少分类器都是一个r类的分类器,但都是不一样的分类器。例如,经过MM,选出了3个类别,这三个类别分别是2,4,5,他们对应的概率是分别最大的三个,类别2对应的概率最大,4其次,5对应的概率第三大。然后根据决策规则决定是直接输出这个物体的类别是2,还是需要送到LM模块的245少分类器中。
多模块(More Module)是相对与模型后面的少模块(Less Module),意思是识别的类别是较多,少模块分得类别较少。MM<K>的输出是K个概率以及对应的K个类别,K个类别分别是C1,K个概率中的一个表示为Pl(i),MAXr意思是取得最大的r个概率,因为这些最大的r个概率是最有可能包含正确的类。不是所有的测试数据xl会被送到LM中,只是其中的一些数据有可能送到LM中。每个LM是一个r类的分类模块,测试数据Xl只能被送到个LM中的一个,至于是哪一个r类LM中,是由MAXr中选出的r个概率所对应的决定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010197945.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:承载能力大的轻型汽车变速器
- 下一篇:危险废物焚烧系统进料通道密封装置