[发明专利]识别对象的系统及方法无效
申请号: | 95104385.4 | 申请日: | 1995-04-10 |
公开(公告)号: | CN1092375C | 公开(公告)日: | 2002-10-09 |
发明(设计)人: | 鲁道夫·M·鲍勒;琼纳森·H·康奈尔;诺曼·哈斯;拉科什·莫汉;加布里尔·塔乌宾 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06T7/60 | 分类号: | G06T7/60 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 付建军 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 对象 系统 方法 | ||
本发明涉及利用计算机化的光学扫描设备识别(即,辨认、分类、分级和检验)对象的领域。更具体地,本发明是涉及用图象处理技术识别散装货物的一种可训练系统和方法。
现有技术中存在用于识别对象的图象处理系统,这些系统用直方图来实现这种识别。一种常见的直方图方法是从包含某个对象的(彩色)图象中产生一个灰度直方图或彩色直方图。然后再把这些直方图和参考图象的直方图直接进行比较。或者,抽取这些直方图的特征,并且和从包含参考对象的图象的直方图中的特征进行比较。
参考直方图或这些直方图的特征通常被存在计算机存储器中。现有技术一般用这种方法来验证图象中的目标对象的确是所期望的对象,并且还可能根据相对于参考直方图的其外表的质量来分级/分类该对象。另一个目的可以是通过比较目标图象对象的直方图和多个对象的参考图象的直方图来辨认目标对象。
在本文中,辨认被定义为:给定一组参考对象或类别,决定目标对象是哪个参考对象或目标对象属于哪个参考类别。分类或分级被定义为:确定目标对象被看作是某个对象并且/或者该对象的质量为某个定量的值。这里,类别中的一个可能是“反”类,意味着对象的质量太差,或者该对象不是已知类别中的成员。另一方面,验证被定义为:确定目标为某个对象或类别,并且简单地验证这是真的或是假的。识别被定义为辨认、分类、分级和/或验证。
散装货物包括在超级市场、食品杂货店、零售店或五金商店中散装出售的任何货物。例如农产品(水果和蔬菜)、糖、咖啡豆、糖果、铁钉、螺母、螺栓、普通五金器件、零配件和包装货物。
在图象处理技术中,数字图象就是由摄象机得到的模拟图象,通过把该图形划分为称之为图形元素的固定数量的位置、并把在这些图形元素上的图象的值量化为固定数量的值而使之转换为一种离散表示法。所得到的数字图象可由某个计算机算法处理以开发其他的图象。这些图象可以被存在存储器中,并且/或者被用来确定被成象对象的有关信息。象素就是数字图象的图形元素。
图象处理和计算机视觉就是通过对数字图象的计算机处理来修改图象或者从该图象中获取被成象对象的性质,例如对象的特性、位置等等。
景物包括一个或多个感兴趣的对象比及同对象一块被成象的环境。这些环境也被称为背景。背景通常比感兴趣的对象离摄象机更远一些。
图象分割(也被称为图形/背景分离)就是把一个景物图象分割为单独的对象和背景图象。分割指的是辨认与属于背景的图象的象素相对的那些被包含在对象的图象中的象素。因此,被分割的对象图象就是组成完整景物的原始图象中的对象的象素集。被分割对象图象的面积为对象图象中的象素的个数。
照明度是指照明景物及其中对象的光线。整个景物的照明度直接决定景物中单个对象的照明度,以及由成象装置(如摄象机)所接收到的对象的反射光。
环境照明度是指来自除了专门用于成象某个对象的特定光线之外的任何光源的照明度。例如,环境照明度是由于类似户外太阳光和室内光线这样的环境中产生的光源的照明度。
闪耀或镜子式的反光指的是由光亮的(象镜子那样的、可能是局部的反射特性)对象反射出来的大量光线。闪耀的色彩主要是照明光线的色彩(对比对象的自然色彩)。
图象的特征被定义为该图象的任何特性,能够通过计算来提取。特征通常具有在某个范围中(比如说R0-R1)的数值。在现有技术中,直方图是在整个图象或图象的窗口(子图)上被计算的。图象的某个特征的直方图是在图象或窗口上特征值分布的数字表示。通过把特征范围R0-R1划分为M个间距(箱)并对每个图象的象素计算特征来产生特征的直方图。只需计数有多少个图象或窗口的象素落在给出特征直方图的每个箱子中。
图象特征包括(但并不局限于)色彩和质地。色彩是一种二维的特性,例如色调和饱和或其他的象素色彩描述(下面将给出说明),但通常按三维特性处理,即红、绿和蓝(RGB)的数量。用在现有技术中的各种色彩描述包括:(1)RGB空间;(2)对立色彩空间;(3)Mun-sell(H,V,C)色彩空间;以及(4)色调、饱和、亮度(H,S,I)空间。对于后者来说,类似Munsell空间,色调指的是象素的色彩(从红到绿到蓝),饱和是指色彩的“深度”(例如从带绿色到深饱和的绿色),而亮度则指光亮度,或者在灰度图象中,象素呈现的样子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/95104385.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:装有除尘装置的缝纫机
- 下一篇:跳跃式打印机驱动方法