[发明专利]图像中目标物的消融方法、装置、计算机设备及介质有效
申请号: | 202111003756.8 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113674142B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 佟玲玲;李玉惠;井雅琪;任博雅;段东圣;段运强;时磊;傅强;蔡琳;阿曼太;梁彧;马寒军;田野;王杰;杨满智;金红;陈晓光 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;恒安嘉新(北京)科技股份公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06N3/0464;G06N3/08;G06V10/762 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 李彩玲 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 目标 消融 方法 装置 计算机 设备 介质 | ||
1.一种图像中目标物的消融方法,其特征在于,包括:
获取多个训练样本图像,并根据各训练样本图像中预先标注的标识框的长宽值和距离重叠度DIou损失函数的损失值,计算得到至少一个锚点框的长宽值;
根据各锚点框的长宽值,对YoLoV5改进模型进行参数设置,并使用各训练样本图像对参数设置后的YoLoV5改进模型进行训练,得到目标检测模型;
将待处理的目标图像输入至目标检测模型中,获取目标检测模型针对目标图像输出的至少一个目标物标识框;
根据目标物标识框所限定的图像区域进行消融处理,得到目标消融图像。
2.根据权利要求1所述的方法,其特征在于,根据各训练样本图像中预先标注的标识框的长宽值和DIou损失函数的损失值,计算得到至少一个锚点框的长宽值,包括:
获取多个初始化的聚类中心,所述聚类中心为初始化的锚点框的长宽值;
通过计算各标识框的长宽值与各聚类中心之间的DIou损失函数的损失值,将各所述标识框的长宽值聚类至匹配的聚类中心处,得到多个聚类类别;
重新计算与每个聚类类别分别对应的新的聚类中心后,返回执行通过计算各标识框的长宽值与各聚类中心之间的DIou损失函数的损失值,将各所述标识框的长宽值聚类至匹配的聚类中心处,得到多个聚类类别的操作,直至满足结束聚类条件;
将结束聚类后的各聚类中心,作为各锚点框的长宽值。
3.根据权利要求1所述的方法,其特征在于,在使用各训练样本图像对参数设置后的YoLoV5改进模型进行训练,得到目标检测模型之前,还包括:
基于Mixup算法,将各所述训练样本图像两两之间进行比例混合,得到混合样本图像,并为各所述新的训练样本图像分配匹配的标识框;
基于Mosaci算法,将各所述混合训练样本图像进行拼接处理,得到多个拼接样本图像,作为新的训练样本图像。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述YoLoV5改进模型中包括:依次相连的主干网络、特征提取网络以及预测输出网络;
其中,所述特征提取网络中包括按照特征金字塔网络PANet组织构建的多个跨阶段CSP瓶颈层,每个CSP瓶颈层用于形成设定维度下的单维度特征提取结果输出至所述预测输出网络;
所述特征提取网络还包括:特征合并层,所述特征合并层的输入端分别与各所述跨阶段CSP瓶颈层的输出端相连;
所述特征合并层,用于将各维度下的单维度特征提取结果进行特征拼接,得到组合维度特征提取结果输出至所述预测输出网络;
所述预测输出网络,用于根据各所述单维度特征提取结果,以及所述组合维度特征提取结果,得到对目标物标识框的预测结果。
5.根据权利要求1所述的方法,其特征在于,在获取目标检测模型针对目标图像输出的至少一个目标物标识框之后,还包括:
如果确定与所述目标图像匹配的消融需求为目标类别的图像内容,则在所述目标检测模型输出的各目标物标识框中,仅保留与所述目标类别匹配的目标物标识框。
6.根据权利要求1所述的方法,其特征在于,在获取目标检测模型针对目标图像输出的至少一个目标物标识框之后,还包括:
如果确定与所述目标图像匹配的消融需求为目标文本内容,则分别对所述目标检测模型输出的各目标物标识框所限定的图像区域进行光学字符识别,获取与各所述图像区域分别对应的图像识别结果;
仅保留图像识别结果中包括目标文本内容的目标物识别框,并根据所述目标文本内容在图像识别结果中的位置,对保留的各目标物识别框进行重定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;恒安嘉新(北京)科技股份公司,未经国家计算机网络与信息安全管理中心;恒安嘉新(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111003756.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种集成封装LED灯珠
- 下一篇:保护膜以及触控显示模组
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序