[发明专利]图像处理方法及装置、计算机可读介质和电子设备有效
申请号: | 201810639830.7 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108846440B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 王亚彪;崔志鹏;王文全;葛彦昊;汪铖杰;李季檩;黄飞跃;吴永坚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/82;G06N3/0464 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 计算机 可读 介质 电子设备 | ||
本发明公开了一种图像处理方法及装置、计算机可读介质和电子设备,涉及图像处理技术领域。该图像处理方法包括:获取图像的特征图;将图像的特征图输入基础神经网络进行处理以确定图像中的目标对象;其中,基础神经网络包括多个堆叠的卷积处理模块,每一卷积处理模块对输入的特征图执行处理包括:对输入的特征图进行1×1降维卷积处理以得到第一特征图;对第一特征图进行1×1扩展卷积处理以得到第二特征图;对第一特征图进行深度可分离卷积处理以得到第三特征图;基于第二特征图和第三特征图生成该卷积处理模块输出的特征图。本公开可以快速检测图像中的目标对象。
技术领域
本公开涉及图像处理技术领域,具体而言,涉及一种图像处理方法、图像处理装置、计算机可读介质和电子设备。
背景技术
随着图像处理技术的发展,目标检测越来越广泛地应用到例如人机交互、智能监控、安全检查、数字娱乐、数码相机等各个领域。所谓目标检测,就是在一图像中检测感兴趣的目标(例如,手势、人脸、汽车等)的技术方案,另外,这里所说的图像可以是照片、静态图片、视频图像等。
近来,采用神经网络进行目标检测的技术方案可以包括单步法(one-stagedetector)和两步法(two-stage detector)。然而,目前无论是单步法还是两步法均存在模型大、计算速度慢的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种图像处理方法及装置、计算机可读介质和电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的目标检测模型大、计算速度慢的问题。
根据本公开的一个方面,提供一种图像处理方法,包括:获取图像的特征图;将图像的特征图输入基础神经网络进行处理以确定图像中的目标对象;其中,基础神经网络包括多个堆叠的卷积处理模块,每一卷积处理模块对输入的特征图执行处理包括:对输入的特征图进行1×1降维卷积处理以得到第一特征图;对第一特征图进行1×1扩展卷积处理以得到第二特征图;对第一特征图进行深度可分离卷积处理以得到第三特征图;基于第二特征图和第三特征图生成该卷积处理模块输出的特征图。
根据本公开的一个方面,提供一种图像处理装置,包括:特征获取模块,用于获取图像的特征图;对象确定模块,用于将图像的特征图输入基础神经网络进行处理以确定图像中的目标对象;其中,基础神经网络包括多个堆叠的卷积处理模块,每一卷积处理模块包括:第一卷积单元,用于对输入的特征图进行1×1降维卷积处理以得到第一特征图;第二卷积单元,用于对第一特征图进行1×1扩展卷积处理以得到第二特征图;第三卷积单元,用于对第一特征图进行深度可分离卷积处理以得到第三特征图;特征图生成单元,用于基于第二特征图和第三特征图生成该卷积处理模块输出的特征图。
可选地,第三卷积单元包括:第一卷积子单元,用于对第一特征图的各维度分别进行3×3卷积处理,以得到与第一特征图维度相同的中间特征图;第二卷积子单元,用于对中间特征图进行1×1卷积处理,以得到第三特征图。
可选地,基础神经网络还包括:最大池化模块,用于在将特征图输入多个堆叠的卷积处理模块中预定卷积处理模块之前,对特征图进行最大池化处理。
可选地,第三卷积单元还包括:第一批量归一化单元和第一线性整流单元,分别用于对中间特征图进行批量归一化处理和线性整流处理。
可选地,第三卷积单元还包括:第二批量归一化单元和第二线性整流单元,分别用于对第二卷积子单元处理后的中间特征图进行批量归一化处理和线性整流处理,以得到第三特征图。
可选地,对象确定模块包括:特征发送单元,用于将所述基础神经网络输出的特征图发送至一输出神经网络;其中,所述输出神经网络用于采用预设候选区域预测的方式根据所述基础神经网络输出的特征图确定所述目标对象的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810639830.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序