[发明专利]超像素采样网络在审
申请号: | 201910333965.5 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110428422A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | V·扬帕尼;孙德庆;刘洺堉;J·考茨 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/187;G06K9/62;G06N3/04 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;卜璐璐 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 像素采样 像素 神经网络输出 关联 多次迭代 简单线性 神经网络 网络利用 像素特征 像素中心 网络 耦合到 迭代 聚类 更新 | ||
本发明公开了一种超像素采样网络。超像素采样网络利用耦合到可微分简单线性迭代聚类组件的神经网络从由神经网络输出的一组像素特征来确定像素‑超像素关联。超像素采样网络通过多次迭代计算更新的超像素中心和最终像素‑超像素关联。
相关申请的交叉引用
根据美国法典第35篇第119(e)条,本申请要求于2018年5月1日提交的序列号为62/665,325的美国申请的优先权和权益,其内容通过引用整体并入本文。
背景技术
超像素是通过基于低级图像特性对图像像素进行分组而形成的图像的过分割。超像素提供图像内容在视觉上有意义的细分,从而减少用于后续图像处理的图像基元的数量。由于其代表性和计算效率,超像素已成为已建立的低/中级图像表示,并广泛用于计算机视觉算法,例如物体检测、语义分割、显著性估计、光流估计、深度估计、跟踪等。超像素尤其广泛用于传统的能量最小化框架中,其中较少数量的图像基元降低了优化复杂性。
已经针对广泛的计算机视觉问题采用了深度学习技术。除少数方法外,超像素几乎不与现代深度网络结合使用。这有两个主要原因:1)构成了大多数深度架构的基础的标准卷积运算,通常在规则网格点阵(lattice)上定义,并且在不规则超像素点阵上运算时变得效率低下;2)现有的超像素算法是不可微分的,因此在深度网络中利用超像素将不可微分的模块引入了其他端到端的可训练网络架构中。
发明内容
本文公开了用于实现用于超像素分割的深度可微分算法的系统的实施例。通过放宽简单线性迭代聚类(SLIC)中存在的最近邻约束,将SLIC超像素算法转换为可微分算法。这种可微分算法使能端到端训练,并允许利用深度网络学习超像素,而不是使用传统的手工制作特征。深度网络与可微分SLIC的组合形成了端对端可训练的超像素算法,即超像素采样网络(SSN)。
与传统的超像素算法相比,SSN具有以下特性:
1.端到端可训练:SSN是端到端可训练的,并可以高效地集成到其他深度网络架构中。
2.灵活且任务特定:SSN使能采用灵活的损失函数学习,从而致使学习特定任务的超像素。
3.最先进的性能:SSN在许多类型的数据集上可能优于传统的超像素算法,使机器或计算机能够在确定超像素时更高效地运行。
4.有利的运行时间:与传统的超像素算法相比,SSN在运行时间方面也具有更高效的运行时间,因此使能在大型数据集上进行学习,并在许多实际应用中实现更高的效率。
附图说明
为了容易地识别对任何特定元件或动作的讨论,参考标号中的最显著的一个或更多个数字指的是首先引入该元件的图号。
图1示出了超像素采样网络100的实施例。
图2示出了超像素采样网络200的实施例。
图3示出了超像素化方法300的实施例。
图4为计算系统400的框图,在计算系统400中可以呈现或实行本文引入的技术。
图5为可以包含本发明的实施例的计算装置500的示例性框图。
具体实施方式
除非另有明确说明或暗示,否则本文使用的术语应当提供其在本领域中的常规含义。
“可微分算法”是指采用全部连续的且可微分的计算分量的算法。
“最近邻约束”指的是属于同一群集/邻域的项的距离限制。
“端到端训练”指的是在没有监督(手动)干预的情况下从采样数据集学习的网络。
“深度网络”是指具有多于一个隐藏层的神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910333965.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:黄斑图像区域分割方法和设备
- 下一篇:一种区域编辑方法、编辑设备及编辑系统