[发明专利]从机器学习模型输出推断出的实例分割在审
申请号: | 201980041346.7 | 申请日: | 2019-06-19 |
公开(公告)号: | CN112334906A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | S·塔里克;J·W·V·菲尔宾;K·戈埃尔 | 申请(专利权)人: | 祖克斯有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 夏青 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 输出 推断 实例 分割 | ||
1.一种方法,包括:
提供图像作为机器学习(ML)模型的输入;
接收包括多个特征的特征地图作为从所述ML模型的输出,所述多个特征中的特征包括置信度得分、分类信息和根据非最大抑制(NMS)技术确定的感兴趣区域(ROI);以及
关联具有相似ROI的特征子集作为实例分割。
2.根据权利要求1所述的方法,其中,所述具有相似ROI的特征子集包括被指示为经由所述NMS技术被抑制的特征。
3.根据权利要求2所述的方法,其中,确定输出与第一特征相关联的第一ROI包括:
确定所述第一ROI和与所述特征子集相关联的置信度得分的子集的最大置信度得分相关联;以及
输出所述第一ROI以关联所述图像的区域为表示对象。
4.根据权利要求1所述的方法,还包括输出与所述实例分割相对应的掩模,以标识所述图像的像素为表示对象。
5.根据权利要求1所述的方法,还包括至少部分地基于提供一批图像作为所述ML模型的输入来训练所述ML模型,其中所述一批图像包括与第一对象分类相关联的第一预定数量的图像、和与第二对象分类相关联的第二预定数量的图像,
其中,所述第一预定数量和第二预定数量至少部分地基于所述多个特征的一个或多个置信度水平。
6.根据权利要求1所述的方法,还包括训练所述ML模型以基本同时输出针对每个特征的、对应于多个分类的多个ROI,所述多个分类包括车辆、行人或自行车中的一个或多个。
7.根据权利要求1所述的方法,其中,所述ROI包括边界框。
8.根据权利要求1至7中任一项所述的方法,还包括至少部分地基于由所述ML模型输出的ROI或所述实例分割中的至少之一来生成用于控制自主车辆的运动的轨迹。
9.一种包括编码指令的计算机程序产品,当所述编码指令在计算机上运行时实现根据权利要求1至7中任一项所述的方法。
10.一种系统,包括:
一个或多个处理器;以及
一个或多个计算机可读介质,其存储可由所述一个或多个处理器执行的指令,其中,所述指令在被执行时使所述系统执行以下操作,包括:
提供图像作为机器学习(ML)模型的输入;
通过所述ML模型,确定包括多个特征的特征地图,所述多个特征中的特征包括感兴趣区域(ROI)、标识和置信度得分;以及
至少部分地基于与所述多个特征相关联的标识,输出输出图像作为实例分割。
11.根据权利要求10所述的系统,其中,根据非最大抑制(NMS)技术确定所述特征的ROI,所述NMS技术包括:
确定与所述特征相关联的置信度得分达到或超过阈值置信度得分;
确定所述ROI和与达到或超过阈值对准度的对应特征的对应ROI的对准度相关联;
确定所述对应ROI作为所述ROI;以及
确定所述对应特征的对应标识作为所述标识。
12.根据权利要求10或11所述的系统,其中,所述操作还包括:将所述实例分割作为掩模输出,所述掩模将所述图像的像素标识为表示与对象分类相关联的对象。
13.根据权利要求12所述的系统,所述操作还包括:
至少部分地基于所述掩模,确定被配置为使自主车辆穿越环境的一部分的轨迹;以及
向所述自主车辆提供所述轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于祖克斯有限公司,未经祖克斯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980041346.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于螺旋采集的MR体模
- 下一篇:弱结晶过渡金属钼钨酸盐