[发明专利]用于选择用于分类输入数据的特征的信息处理设备有效
申请号: | 200980137582.5 | 申请日: | 2009-09-15 |
公开(公告)号: | CN102165488A | 公开(公告)日: | 2011-08-24 |
发明(设计)人: | 藤森友贵;真继优和;御手洗裕辅 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06F17/30;G06T1/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 选择 分类 输入 数据 特征 信息处理 设备 | ||
技术领域
本发明涉及在从输入数据项提取出的多个特征量中选择对这些输入数据项进行分类要使用的特征量的信息处理设备,并且涉及信息处理方法等。
背景技术
对于外观检查等用的信息处理设备,存在以下方案:从检测对象物体的所拍摄图像中提取诸如像素值的平均值和方差等的各种特征量的组,并且判断检查对象物体有无缺陷(分成无缺陷产品和缺陷产品这两类)。然而,当使用了所有这些大量的特征量时,特征的维数变为高阶。发生了在特定维数中出现的(诸如维数灾难(curse of dimensionality)等的)问题、或者由提取冗余的特征量所引起的处理时间增加。
因此,正注重以下方案:通过选择适当的特征量来防止容易发生在特定维数中出现的问题,并且提高了运算处理的速度。
在下文,将说明非专利文献1所公开的方案。在非专利文献1中,公开了以下方案:针对各个特征量确定用于评价分离度的评价值,并且基于这些评价值按从更优的评价值开始的顺序选择特征量。具体地,该方案是使用贝叶斯错误概率(Bayes-error-probability)估计值、或者类内方差与类间方差的比来确定选择标准的特征选择方案。
将详细说明贝叶斯错误概率估计值。例如,在两类问题的情况下,当由w1和w2来表示两个类、并且由xO=[x1,x2,…,xk,…,xN]来表示观察到的特征时,由P(w1|xk)和P(w2|xk)来分别表示xk属于w1和w2的概率。在这种情况下,通过以下公式表示贝叶斯错误概率估计值。
表达式1
Bayes=∫min{P(w1|xk),P(w2|xk)}dxk (公式1)
针对各个特征量确定贝叶斯错误概率估计值。贝叶斯错误概率估计值越低表示越适合用来将两个类彼此分离。因此,可以按贝叶斯错误概率估计值的升序来选择特征量。
接着,将详细说明类内方差与类间方差的比。例如,在两类问题的情况下,当由w1和w2来表示两个类、并且由xO=[x1,x2,…,xk,…,xN]来表示观察到的特征时,确定与特征量xk相关联的类内方差与类间方差的比。另外,由Ai来表示属于类wi的图案的集合。由ni来表示Ai中包括的图案的数量。由mi来表示属于类wi的图案的xk的平均值。此外,由n来表示所有图案的数量,并且由m来表示所有图案的xk的平均值。在这种情况下,
表达式2
类内方差和类间方差
通过以下公式来表示表达式2。
表达式3
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980137582.5/2.html,转载请声明来源钻瓜专利网。