[发明专利]处理图像的方法和装置在审
申请号: | 202210317283.7 | 申请日: | 2022-03-28 |
公开(公告)号: | CN114708481A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 高志华 | 申请(专利权)人: | 阿里云计算有限公司 |
主分类号: | G06V10/94 | 分类号: | G06V10/94;G06V40/16;G06V40/10;G06V20/00;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 柴海平;许怀远 |
地址: | 310024 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 图像 方法 装置 | ||
本申请实施例提供了一种处理图像的方法和装置,用以解决目标检测模型的算法库占用存储空间较大以及计算效率较低的问题。该方法包括:将待处理的第一特征图输入至RPN网络中,以得到多个建议区域,每个建议区域对应于:目标的得分以及目标的框坐标;根据多个建议区域,获取第二特征图,第二特征图中包括多个建议区域;将第二特征图输入至全连接层网络进行处理,以得到输出结果,输出结果包括:目标的得分、目标特征信息以及目标的框坐标。该方法利用一个算法模型同时进行目标检测及目标特征检测,减少了算法库占用的存储空间,并且只需要一次端到端的计算便实现目标检测和目标特征检测,节省了计算时间和计算资源。
技术领域
本申请涉及信息技术领域,尤其涉及一种处理图像的方法和装置。
背景技术
近年来,随着深度学习和卷积神经网络(convolutional neural networks,CNN)的发展和进步,基于图像的目标检测和分类能力已经得到很大的提高。目标检测是计算机视觉领域的一个重要研究方向,是众多高级任务的必备前提,例如,场景理解,事件识别等。目标检测也广泛应用于安全监测、自动驾驶、人机交互、增加现实、行人检测、大规模场景识别等领域。目标检测对计算机视觉和产业界实际应用都有重要的意义。
如今,基于深度学习的目标检测方式已经超越传统目标检测方法,成为当前目标检测领域的主流方法。深度学习的核心是特征学习,可以通过分层网络获取分层次的特征信息,并输出结果。深度学习框架下的典型算法包括CNN,CNN具有特征提取、特征选择和特征分类的功能。
在CNN中,目标检测方法包括两个部分的基础算法,即目标位置检测和目标特征检测。以人脸识别为例,目标位置检测包括人脸位置检测,目标特征检测包括人脸特征点检测,例如,眼睛、鼻子、嘴以及脸的边缘点的检测。在现有的方案中,上述两种基础算法通常需要不同的算法模型实现,算法库占用了较多的存储空间,并且计算时间也较长。例如,对于智能手机等存储空间有限的终端设备来说,占用了过多的存储资源和计算时间,用户体验较差。
因此,业界正在研究计算效率更高的目标检测方法,以期减少存储空间和计算时间。
发明内容
本申请提供了一种处理图像的方法和装置,用以解决目标检测模型的算法库占用存储空间较大以及计算效率较低的问题。
第一方面,提供了一种用于处理图像的方法,包括:将待处理的第一特征图输入至RPN网络中,以得到多个建议区域,每个建议区域对应于:目标的得分以及目标的框坐标;根据所述多个建议区域,获取第二特征图,所述第二特征图中包括所述多个建议区域;将所述第二特征图输入至全连接层网络进行处理,以得到输出结果,所述输出结果包括:目标的得分、目标特征信息以及目标的框坐标。
可选地,上述目标可以指需要进行目标检测的任何物体,例如人脸、人体、动物、车辆、建筑物等。
结合第一方面,在一种可能的实现方式中,所述根据所述多个建议区域,获取第二特征图,包括:将所述多个建议区域的位置坐标映射至所述第一特征图之上;通过RoI池化层将所述多个建议区域池化为同一尺寸;将所述多个建议区域相连,得到所述第二特征图。
结合第一方面,在一种可能的实现方式中,所述将所述第二特征图输入至全连接层网络进行处理,以得到输出结果,包括:通过GAP算子将所述第二特征图映射至第一向量;将所述第一向量输入至所述全连接层网络,以得到所述输出结果。
其中,上述第一向量的长度可以是预设长度。通过GAP算子对第二特征图映射之后,只得到一个向量,再根据该向量进行全连接层的操作,可以在学习过程中节省很多参数,减少计算复杂度。
结合第一方面,在一种可能的实现方式中,所述目标为人脸,所述目标特征信息包括以下至少一项:人脸特征点的坐标、人脸对应的年纪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210317283.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序