[发明专利]一种从图像中确定物体所在区域的方法及装置有效
申请号: | 201910106122.1 | 申请日: | 2019-02-01 |
公开(公告)号: | CN111523533B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 杨攸奕;武元琪;李名杨 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/42 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 确定 物体 所在区域 方法 装置 | ||
本申请提供一种从图像中确定物体所在区域的方法及装置。其中,所述从图像中确定物体所在区域的方法包括:获取待识别图像;获取所述待识别图像的特征图数据;获得所述特征图数据中的物体分;根据所述物体分确定所述待识别图像中的物体所在区域。采用本申请提供的方法,以提高物体识别的计算效率。
技术领域
本申请涉及物体识别领域,具体涉及一种从图像中确定物体所在区域的方法及装置。
背景技术
目前,基于区域的物体识别方法一直是物体识别领域的主流方法。当前,绝大多数高级的基于区域的物体探测器是使用感兴趣区域池化层与区域候选网络结合来实现的。
通过从高阶的卷积神经网络(Convolutional Neural Network,CNN)特征中学习嵌入的空间信息,基于区域的物体探测器相对于诸如可变型部件模型(Deformable PartsModel,DPM)等传统的非CNN方法而言,已经取得了巨大的进步。最近,基于区域的全卷积网络(Region-based Fully Convolutional Network,R-FCNs)通过在最后的FCN(FullyConvolutional Network)特征图上的感兴趣区域池化层来减少重复预测的开销,进一步优化了物体识别的性能和计算效率。
但是,目前这些基于区域的物体识别方法,必须使用大量的边框标注训练数据进行模型训练来获得物体分,进而导致物体识别的计算效率低。尤其是在高级的区域候选网络(RPN)中,当采用的CNN的卷积核的尺寸增加后,训练参数的计算量非常庞大,进一步降低了物体识别的计算效率
发明内容
本申请提供一种从图像中确定物体所在区域的方法及装置,以提高物体识别的计算效率。
本申请提供一种从图像中确定物体所在区域的方法,包括:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域。
可选的,所述获取所述待识别图像的特征图数据,包括:
利用卷积神经网络针对所述待识别图像进行特征提取,获取所述待识别图像的特征图数据。
可选的,获得所述特征图数据中的物体分,包括:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果;
根据所述卷积结果,获得所述特征图数据中的物体分。
可选的,所述从图像中确定物体所在区域的方法,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
可选的,所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
可选的,所述根据所述候选卷积核的尺寸信息,获得所述卷积核,包括:
根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸;
将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910106122.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序