[发明专利]基于人工智能的图像处理方法、装置有效
申请号: | 202010276157.2 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111488887B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 向天戈 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 图像 处理 方法 装置 | ||
本发明公开了一种基于人工智能的图像处理方法、装置。其中,该方法包括:采用获取待处理的第一图片的第一特征信息,对第一特征信息进行采样,得到记录有第一图片的全局信息的第一卷积核,使用第一卷积核与第一标准卷积核进行卷积,得到目标神经网络模型中的第一动态卷积核;将第一特征信息与第一动态卷积核进行卷积,得到第一图片的第一特征集合。本发明解决了卷积神经网络的图像特征提取方式过于单一,对于图像的全局信息不够敏感的技术问题。
技术领域
本发明涉及计算机领域,具体而言,涉及一种基于人工智能的图像处理方法、装置、存储介质以及电子装置。
背景技术
目前的图像处理相关技术中,卷积神经网络作为较好的特征提取器,已经在很多基础的视觉任务上获得了成功,如图像分类、图像分割、物体检测、物体定位、物体识别等。传统的卷积过程是利用多个参数可更新的(可学习的)卷积核来提取输入信息的深层特征。然而这种传统的卷积方式在进行特征提取时,通过固定的卷积核进行卷积,提取的特征信息会较为片面,不能很好的捕获输入图片的全局信息,仅仅基于输入信息的局部信息进行卷积,例如,在一张图片中,仅仅能够通过卷积神经网络识别图像中的特定目标对象,但对于特定目标对象所处的环境以及特定目标对象的行为难以基于输入图片进行进一步识别,存在相关技术中卷积神经网络的特征提取方式较为单一的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于人工智能的图像处理方法、装置、存储介质以及电子装置,以至少解决卷积神经网络的图像特征提取方式过于单一,对于图像的全局信息不够敏感的技术问题。
根据本发明实施例的一个方面,提供了一种基于人工智能的图像处理方法,包括:获取待处理的第一图片的第一特征信息,其中,所述第一特征信息用于表示所述第一图片;对所述第一特征信息进行采样,得到第一卷积核,所述第一卷积核记录有所述第一图片的全局信息;使用所述第一卷积核与第一标准卷积核进行卷积,得到目标神经网络模型中的第一动态卷积核;将所述第一特征信息与所述第一动态卷积核进行卷积,得到所述第一图片的第一特征集合。
可选地,所述对所述第一特征信息进行采样,得到第一卷积核,包括:对所述第一特征信息W×H×C进行全局平均下采样,得到1×1×C的第一向量,其中,W用于表示所述第一特征信息的宽度,H用于表示所述第一特征信息的长度,C用于表示所述第一特征信息的通道数;对所述第一向量进行上采样,得到k×k×C的所述第一卷积核,其中,所述k为预设的卷积核大小。
可选地,在将所述第一特征信息与所述第一动态卷积核进行卷积,得到动态更新后的所述第一图片的第一特征集合之后,所述方法还包括:将所述第一标准卷积核进行更新,得到第二标准卷积核。
可选地,所述将所述第一标准卷积核进行更新,得到第二标准卷积核,包括:将所述第一特征信息和所述第一图片的第一特征集合输入损失函数模型,得到目标损失函数值;基于所述目标损失函数值通过反向传播的方式更新所述第一标准卷积核,得到所述第二标准卷积核。
可选地,在将所述第一标准卷积核进行更新,得到第二标准卷积核之后,所述方法还包括:获取待处理的第二图片的第二特征信息,其中,所述第二特征信息用于表示所述第二图片;对所述第二特征信息进行采样,得到第二卷积核,所述第二卷积核记录有所述第二图片的全局信息;使用所述第二卷积核与所述第二标准卷积核进行卷积,得到第二动态卷积核;将所述第二特征信息与所述第二动态卷积核进行卷积,得到动态更新后的所述第二图片的第二特征集合。
可选地,在将所述第一全局信息与所述第一动态卷积核进行卷积,得到所述第一图片的特征信息之后,所述方法还包括:将所述第一特征信息与所述第一图片的第一特征集合相加,得到第一输出结果,其中,所述第一输出结果用于识别所述第一图片中的目标对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010276157.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序