[发明专利]图像获取方法、相关装置及存储介质有效
申请号: | 202210578376.5 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114943639B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06V10/40;G06V10/74;G06V40/16 |
代理公司: | 北京箴思知识产权代理有限公司 11913 | 代理人: | 李春晖 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 获取 方法 相关 装置 存储 介质 | ||
本申请涉及计算机视觉领域,提供一种图像获取方法、相关装置及存储介质。该方法包括:获取原始图像及权重向量;基于原始图像和权重向量,获取加权图像、第一数据和第二数据;若所述第一数据小于第一预设阈值,或所述第二数据小于第二预设阈值,则更新所述权重向量、所述第一数据和所述第二数据,直至第一数据不小于第一预设阈值且第二数据不小于第二预设阈值;基于最后一个时间步长更新得到的权重向量,从所述原始图像中获取关键图像。本申请实施例的图像获取方法通过对权重向量的更新,得到符合预设条件的权重向量,根据所述权重向量对原始图像进行处理,能够使得到的关键图像中原始图像的关键信息尽可能的保留,同时使非关键信息尽可能的去除。
技术领域
本申请实施例涉及计算机视觉领域,更具体地涉及图像获取方法、相关装置及存储介质。
背景技术
深度学习网络通常是以黑盒的形式被使用,只能向深度学习网络输入图像,获得深度学习网络输出的识别结果,无法得知深度学习网络在图像识别过程中关注的信息是否与图像中真正的关键信息相同,从而无法对深度学习网络进行有针对性的优化调整。
目前,通过类激活映射图(Class Activation Mapping,CAM)的技术可以对深度学习网络的不同通道中提取的特征图进行加权融合、归一化、图像尺寸缩放以及热力图转换等操作,得到能够表示深度学习网络在识别过程中关注区域的热力图。热力图中的关注区域可以被看作深度学习网络输出识别结果的依据,即图像识别过程中的重点信息。根据这些重点信息可以对深度神经网络进行优化调整,以使深度神经网络得到的图像识别结果更加准确。然而,热力图中表示出的重点信息可能是图像中的关键信息,也可能是图像中的非关键信息,单独基于热力图又无法区分重点信息中哪些是关键信息,哪些是非关键信息,在基于热力图对深度学习网络进行优化调整时,如果使用错误的依据,产生错误的判断,进而执行了错误的优化调整操作,比如使用热力图中的非关键信息对深度学习网络进行优化调整,则会降低输出的图像识别结果的准确性。
发明内容
本申请实施例提供一种图像获取方法、相关装置及存储介质,通过原始图像和权重向量,获取加权图像、第一数据和第二数据,其中,第一数据表示所述加权图像中保留的原始图像的关键信息与所述原始图像中全部关键信息的比例,所述第二数据表示所述加权图像中去除的原始图像的信息与所述原始图像中全部信息的比例,通过更新权重向量,使第二数据最大,且在第二数据最大的同时使第一数据最大,由于信息去除包括了关键信息去除和非关键信息去除两部分,在对权重向量更新的过程中,第一数据是增大的,从而所去除的信息则主要为非关键信息。
第一方面,本申请实施例提供一种图像获取方法,包括:
获取原始图像以及权重向量;
基于所述原始图像和所述权重向量,获取加权图像、第一数据和第二数据,其中,所述加权图像为所述原始图像基于权重向量加权而得,所述第一数据表示所述加权图像中保留的原始图像的关键信息与所述原始图像中全部关键信息的比例,所述第二数据表示所述加权图像中去除的原始图像的信息与所述原始图像中全部信息的比例;
若所述第一数据小于第一预设阈值,或所述第二数据小于第二预设阈值,则更新所述权重向量、所述第一数据和所述第二数据,直至第一数据不小于第一预设阈值且第二数据不小于第二预设阈值;
基于最后一个时间步长更新得到的权重向量,从所述原始图像中获取关键图像。
第二方面,本申请实施例提供一种图像获取装置,包括:
输入输出模块,用于获取原始图像以及权重向量;
处理模块,用于基于所述原始图像和所述权重向量,获取加权图像、第一数据和第二数据,其中,所述加权图像为所述原始图像基于权重向量加权而得,所述第一数据表示所述加权图像中保留的原始图像的关键信息与所述原始图像中全部关键信息的比例,所述第二数据表示所述加权图像中去除的原始图像的信息与所述原始图像中全部信息的比例;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210578376.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于无线无源的柔性声表面波结冰传感器
- 下一篇:一种液压举升机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序