[发明专利]利用多个对象检测模型在图像中自动选择用户请求的对象在审
申请号: | 202010168321.8 | 申请日: | 2020-03-11 |
公开(公告)号: | CN112287156A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | S·科恩;林哲;凌明阳 | 申请(专利权)人: | 奥多比公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/55;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 对象 检测 模型 图像 自动 选择 用户 请求 | ||
1.一种存储指令的非瞬态计算机可读介质,所述指令在由至少一个处理器执行时,使得计算设备:
根据选择查询,标识要在数字图像中被选择的查询对象;
基于分析所述查询对象,从多个对象检测神经网络中选择利用第一对象检测神经网络,所述多个对象检测神经网络包括专家对象检测神经网络、基于概念的对象检测神经网络、已知对象类别检测神经网络和未知对象类别检测神经网络;
利用所述第一对象检测神经网络,在所述数字图像中检测所述查询对象;
基于所述数字图像中的所检测到的查询对象,利用对象掩模神经网络生成所述所检测到的查询对象的第一对象掩模;以及
响应于所述选择查询,为所述图像提供所述第一对象掩模。
2.根据权利要求1所述的非瞬态计算机可读介质,还包括使得所述计算设备执行以下操作的指令:
利用所述第一对象检测神经网络在所述数字图像内检测所述查询对象的多个实例;以及
利用所述对象掩模神经网络,生成所述所检测到的查询对象的第二实例的第二对象掩模,其中所述第一对象掩模对应于所述所检测到的查询对象的第一实例,并且其中所述第二对象掩模与所述第一对象掩模分离。
3.根据权利要求2所述的非瞬态计算机可读介质,还包括使得所述计算设备执行以下操作的指令:
分析所述选择查询以标识与所述查询对象相关联的对象属性;以及
确定所述所检测到的查询对象的所述第一实例与所述查询对象的所述第二实例相比具有与所述对象属性更大的对应性。
4.根据权利要求3所述的非瞬态计算机可读介质,其中所述指令使得所述计算设备:
通过标识所述查询内与所述查询对象相对应的形容词,来分析所述选择查询以标识所述对象属性;以及
其中与所述所检测到的查询对象的所述第二实例,所述形容词与所述所检测到的查询对象的所述第一实例具有更大的对应性。
5.根据权利要求3所述的非瞬态计算机可读介质,其中所述对象属性是颜色对象属性或位置对象属性。
6.根据权利要求1所述的非瞬态计算机可读介质,还包括使得所述计算设备分析所述选择查询以标识指示所述查询对象的名词的指令。
7.根据权利要求6所述的非瞬态计算机可读介质,还包括使得所述计算设备执行以下操作的指令:
确定所述名词对应于第一专家对象检测神经网络,所述第一专家对象检测神经网络被训练以检测与所述名词匹配的对象,并且
其中所述第一对象检测神经网络包括所述第一专家对象检测神经网络。
8.根据权利要求6所述的非瞬态计算机可读介质,还包括使得所述计算设备执行以下操作的指令:
确定所述名词对应于第一已知对象类别检测神经网络,所述第一已知对象类别检测神经网络被训练以检测多个已知对象类别,其中所述多个已知对象类别包括所述名词,并且
其中所述第一对象检测神经网络包括所述第一已知对象类别检测神经网络。
9.根据权利要求6所述的非瞬态计算机可读介质,还包括使得所述计算设备执行以下操作的指令:
确定所述名词对应于第一未知对象类别检测神经网络,所述第一未知对象类别检测神经网络被训练以基于与未知类别相对应的所述名词而利用概念嵌入过滤来检测所述名词,并且
其中所述第一对象检测神经网络包括所述第一未知对象类别检测神经网络。
10.根据权利要求1所述的非瞬态计算机可读介质,还包括使得所述计算设备执行以下操作的指令:
基于确定所述查询对象,生成所述所检测到的查询对象的近似边界;以及
将所述所检测到的查询对象的所述近似边界提供给所述对象掩模神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥多比公司,未经奥多比公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010168321.8/1.html,转载请声明来源钻瓜专利网。