[发明专利]图像检测、神经网络训练方法、装置和电子设备有效
申请号: | 201710239189.3 | 申请日: | 2017-04-13 |
公开(公告)号: | CN108229523B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 任思捷;陈晓濠;刘建博;孙文秀;严琼;徐立;戴宇荣 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京康达联禾知识产权代理事务所(普通合伙) 11461 | 代理人: | 兰淑铎;张雪飞 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 检测 神经网络 训练 方法 装置 电子设备 | ||
本发明实施例提供了一种图像检测方法、装置和电子设备,以及,一种神经网络训练方法、装置和电子设备。其中,图像检测方法包括:获取待检测图像的多个特征图,其中,多个特征图的分辨率不同;通过神经网络包括的至少一个特征改善层中的每个特征改善层按照分辨率从高到低的顺序依次对多个特征图进行特征提取,将每次特征提取的结果与相邻的后一特征图和/或前一特征图进行特征融合,生成对应的多个特征改善图;使用生成的各特征改善图进行图像检测。通过本发明实施例,可以更为准确地确定待检测图像中的目标对象的位置和信息,以进行高效、精准的图像检测。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种图像检测方法、装置和电子设备,以及,一种神经网络训练方法、装置和电子设备。
背景技术
神经网络是用于计算机视觉和模式识别的一个重要的研究领域,它通过计算机仿照生物大脑思维启发进行类似人类对特定对象的信息处理。通过神经网络如卷积神经网络,能够有效地进行图像检测,从中检测和识别出目标对象。
目前的一种基于传统卷积神经网络的图像检测方法首先通过卷积神经网络产生候选区域,然后再基于候选区域进一步通过卷积神经网络进行目标对象检测。基于传统卷积神经网络自身结构的局限,该传统的图像检测方法对候选区域的定位精度较低,产生的候选结果不准确,进而导致目标对象检测的不准确。
发明内容
本发明实施例提供了一种图像检测方案和一种神经网络训练方案。
根据本发明实施例的第一方面,提供了一种图像检测方法,包括:获取待检测图像的多个特征图,其中,多个特征图的分辨率不同;通过神经网络包括的至少一个特征改善层中的每个特征改善层按照分辨率从高到低的顺序依次对多个特征图进行特征提取,将每次特征提取的结果与相邻的后一特征图和/或前一特征图进行特征融合,生成对应的多个特征改善图;使用生成的各特征改善图进行图像检测。
可选地,针对每个特征改善层,所述按照分辨率从高到低的顺序依次对多个特征图进行特征提取,将每次特征提取的结果与相邻的后一特征图和/或前一特征图进行特征融合,生成对应的多个特征改善图,包括:针对当前特征图,获得与其相邻的分辨率高的前一特征图的第一特征提取结果,和/或,获得与其相邻的分辨率低的后一特征图的第二特征提取结果;将获得的第一特征提取结果和/或第二特征提取结果,与当前特征图进行特征融合,获得与当前特征图对应的特征改善图,所述第一特征提取结果、所述第二特征提取结果各自的分辨率分别与当前特征图相同。
可选地,所述第一特征提取结果通过对所述前一特征图进行卷积和池化处理获得;和/或,所述第二特征提取结果通过对所述后一特征图进行卷积和上采样处理获得。
可选地,所述针对当前特征图,获得与其相邻的分辨率高的前一特征图的第一特征提取结果,和/或,获得与其相邻的分辨率低的后一特征图的第二特征提取结果,包括:如果所述当前特征图为当前特征改善层处理的首个特征图,则对当前特征图进行卷积和池化处理,获得第一特征提取结果并后向输出;接收与其相邻的后一特征图经卷积和上采样处理后获得的第二特征提取结果;和/或,如果所述当前特征图为当前特征改善层处理的末个特征图,则对当前特征图进行卷积和上采样处理,获得第二特征提取结果并前向输出;并接收与其相邻的前一特征图经卷积和池化处理后获得的第一特征提取结果;和/或,如果所述当前特征图为当前特征改善层处理的非首个且非末个特征图,则对当前特征图进行卷积和池化处理,获得第一特征提取结果并后向输出;对当前特征图进行卷积和上采样处理,获得第二特征提取结果并前向输出;并且,接收与其相邻的前一特征图经卷积和池化处理后获得的第一特征提取结果,以及,接收与其相邻的后一特征图经卷积和上采样处理后获得的第二特征提取结果。
可选地,当所述神经网络包括多个相连的特征改善层时,将前一特征改善层输出的各个特征改善图作为相邻的后一特征改善层中对应位置的特征图输入;多个所述特征改善层的神经网络参数相同。
可选地,所述特征改善层采用递归神经网络结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710239189.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序