[发明专利]一种图像处理方法、装置、电子设备及其存储介质有效
申请号: | 201810722616.8 | 申请日: | 2018-07-03 |
公开(公告)号: | CN108875693B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 朱星宇;黄鼎;张诚 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 邓超 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 处理 方法 装置 电子设备 及其 存储 介质 | ||
本发明实施例提供一种图像处理方法、装置、电子设备及其存储介质,涉及图像识别技术领域。该方法包括获取训练数据集并构建标签矩阵;利用训练数据集对深度神经网络中的主网络和多个子网络进行训练,获得第一输出矩阵和第二输出矩阵;根据各子网络对应的场景类别获得第一输出矩阵对应的第一切片矩阵和标签矩阵对应的第二切片矩阵;根据第二输出矩阵、第一切片矩阵和第二切片矩阵计算损失函数,并根据损失函数对所述深度神经网络中的参数进行优化,获得所述主网络对应的场景识别模型。装置用于执行上述方法。本发明实施例通过子网络来对主网络进行训练,从而获得到的场景识别模型在对图像进行场景识别时,能够同时保证高准确率和高召回率。
技术领域
本发明涉及图像识别技术领域,具体而言,涉及一种图像处理方法、装置、电子设备及其存储介质。
背景技术
随着智能手机的相机功能的推广,移动设备并行计算硬件效能大幅进步,以及人民物质与精神生活需求的逐渐提高。人工智能与计算机视觉技术在智能手机的相机中应用市场越来越大。其中基于场景/物体识别的自动后处理技术已经成为了各大手机厂商所需要的技术。
由于基于场景/物体识别的自动后处理技术需要在移动设备上部署,因此,为了不影响移动设备的性能,在需要保证一定准确率的同时,还需要尽量减少参数和计算量,因此,移动设备一般情况下都会采用参数空间较小的模型。目前市场上的模型主要依赖于直接训练,例如通过卷积神经网络等,但是通过直接训练后得到的模型其不能够同时保证对图像的场景识别的高准确率和高召回率。
发明内容
有鉴于此,本发明实施例的目的在于提供一种图像处理方法、装置、电子设备及其存储介质,以解决上述技术问题。
第一方面,本发明实施例提供了一种图像处理方法,包括:
获取训练数据集,并根据所述训练数据集构建标签矩阵;
利用所述训练数据集对深度神经网络中的主网络和多个子网络进行训练,获得所述主网络对应的第一输出矩阵和各所述子网络分别对应的第二输出矩阵;其中,所述主网络用于对所有场景类别进行识别,每一所述子网络用于对相应的场景类别进行识别;
根据各所述子网络对应的场景类别分别对所述第一输出矩阵和所述标签矩阵进行切片划分,获得所述第一输出矩阵对应的第一切片矩阵和所述标签矩阵对应的第二切片矩阵;
根据所述第二输出矩阵、所述第一切片矩阵和所述第二切片矩阵计算损失函数,并根据所述损失函数对所述深度神经网络中的参数进行优化,获得所述主网络对应的场景识别模型。
进一步地,所述根据所述第二输出矩阵、所述第一切片矩阵和所述第二切片矩阵计算损失函数,包括:
根据所述场景类别计算所述第二输出矩阵和所述第一切片矩阵之间的欧式距离;
根据所述场景类别,利用交叉熵计算公式分别计算所述第二输出矩阵和所述第二切片矩阵之间的第一交叉熵,以及所述第一输出矩阵和所述标签矩阵之间的第二交叉熵;
根据所述欧式距离、所述第一交叉熵和所述第二交叉熵获得所述损失函数。
进一步地,所述根据所述场景类别计算所述第二输出矩阵和所述第一切片矩阵之间的欧式距离,包括:
根据计算所述第二输出矩阵中两个行向量之间的欧式距离,获得第一中间矩阵其中dakj为所述第二输出矩阵中第k行向量和第j行向量之间的欧式距离,aki为所述第二输出矩阵中第k行第i个元素值,aji为所述第二输出矩阵中第j行第i个元素值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810722616.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序