[发明专利]一种训练多图案识别和配准工具模型的半监督方法有效
申请号: | 201410301836.5 | 申请日: | 2014-06-26 |
公开(公告)号: | CN104252626B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | S·巴克;D·J·迈克尔 | 申请(专利权)人: | 康耐视公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 图案 识别 工具 模型 监督 方法 | ||
一种训练多图案识别和配准模型的系统和方法,以第一图案模型开始。该模型从多个图像中训练。复合模型可用于提高鲁棒性,或者模型化目标区域外观上的微小差异。复合模型从噪声训练图像中组合数据,显示将要构建单个模型的潜在图案的实例。产生图案识别和配准模型,其可覆盖该组训练图像中目标图案的外观的整个范围。该组图案模型可实现为图案查找模型的单独实例,或者图案多模型。潜在模型可以是标准图案查找模型或者为图案查找复合模型,或者是两者的组合。
相关申请
本申请声明拥有申请号为61/841,142,申请日为6/28/2013,题目为“一种用于训练多重图案匹配模型的半监督方法”的美国临时申请专利的权益,其整个公开内容以参考形式并入至本文中。
技术领域
本发明涉及一种机器视觉,其通过利用摄像头或者其他成像设备获取对象图像,其中对应在被成像对象上定位图案来定位图像中的目标图案。
背景技术
机器视觉系统的困难在于使其方便使用,并且可供更广泛的潜在用户使用。某些方面,用户非常清楚的理解(例如,如何生成一组训练图像),以及情形的地面实况。然而除此之外,机器视觉系统的训练和运行时操作的许多方面的应用更加困难。
在机器视觉中,通过摄像机或其他成像设备获得对象图像,以及利用计算机或其他计算设备上执行的方法,以定位成像对象上的图案。假设有一组图像,每一个图像至少包含一个目标图案的实例,但在目标图案外观可能有差异时,识别并训练可适用于该图像组中所有图像的图案识别和配准模型的最小组合也是困难的。该图案识别和配准程序在美国专利6,408,109;6,658,145以及7,016,539中有更详细的描述,其公开技术以参考形式并入,并作为有用的背景信息。如果图案被识别,则图案识别和配准程序(或工具)确定该被观察图案其实就是该工具搜索的图案,并固定其位置、方位、大小、倾斜度以及外观。例如,这种搜索工具为美国马萨诸塞州内蒂克康耐视公司的产品。该图案识别和配准程序属于几何图案的查找方法。本文描述的方法一般应用到几何图案查找。
例如,图案可由包含圆圈和线条的元素组成。参考图1,图案110包括圆圈112和两条与其相交的直线114、116;图案120包括圆圈122和一对直线124、126;图案130包括圆圈132以及一对直线134、136。在已训练图像的图像组中,该圆圈的半径以及直线的线宽和数量存在差异。在半导体和其他在基板上具有多层结构的材料的领域尤其是这样,这会导致每一层特征变形。也可能在整个图像组中图案的极性改变了(如图所示图案120和130的区别)。该图像还可能含有高度噪声。
该问题至少具有两部分。首先,该训练图像组由带噪声的图像组成,所以很难从单个图像中训练出纯净模型。第二,在该训练组中,图案具有不同的外观,使得训练单个模型变得困难,且易于在运行时出错。
发明内容
为了克服现有技术的缺陷,本系统和方法利用图案识别和配准模型执行训练。说明性地,图案查找模型是从多个训练图像中训练出来的单个模型。在一些实施例中,复合模型可用于提高标准的图案识别和配准模型的鲁棒性,以及/或者对目标区域的外观上的微小差异进行模型化。为了提高鲁棒性,复合模型结合来自带噪声(或其他干扰)的训练图像中的数据,以构成单个鲁棒模型,其中该带噪声的训练图像显示单个潜在(underlying)图案的实例。为了实现此目的,训练单元使用输入图像,以及已知的相对位置或姿势(由人识别或者计算机确定),其中该训练单元为利用图案识别和配准模型的训练单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康耐视公司,未经康耐视公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410301836.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:四轴摆臂换轴机构
- 下一篇:玻璃胶片卷轴放卷设备