[发明专利]特征提取方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202010597972.9 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111914894A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 刘想;陈威;杨邻瑞;谢隆飞;邵小亮;李志福 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 提取 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请提供了一种特征提取方法、装置、电子设备及计算机可读存储介质,应用于目标检测技术领域,其中该方法包括:通过上采样信息融合通道将低分辨率的深层特征图融合到高分辨率的浅层特征图中,以及通过下采样信息融合通道将高分辨率的浅层特征图逐渐融合到低分辨率的高层特征图中,然后对通过两个通道得到的不同分辨率的融合特征进一步融合处理得到目标特征,使得目标特征包含了所有分辨率特征图的特征,从而能通提升目标检测的准确性。
技术领域
本申请涉及目标检测技术领域,具体而言,本申请涉及一种特征提取方法、装置、电子设备及计算机可读存储介质。
背景技术
图像中的目标往往在姿态、尺度、长宽比等方面呈现多样性,使得无法很好的检测出多类别不同大小的目标,尤其在复杂场景下图像背景多变、目标尺度相对较小时,更加难以准确检测到。
目前,通常使用深度卷积神经网络来进行目标检测,例如常用的模型结构有yolov3、Faster R-CNN、retinanet、centernet等。基本流程为:一幅图像经过深度卷积神经网络后得到不同尺寸的特征图(浅层特征与深层特征),使用这些不同层的特征进行预测类别与框。然而,该通过深度卷积神经网络得到的不同尺寸的特征图包含的信息有限,使得目标检测和识别的准确性较差。
发明内容
本申请提供了一种特征提取方法、装置、电子设备及计算机可读存储介质,用于提供一种特征提取方法,使得提取的目标特征包含更多的语义信息,从而能够提升目标检测的准确性。。本申请采用的技术方案如下:
第一方面,提供了一种特征提取方法,用于双通道特征融合网络,双通道特征融合网络包括:上采样信息融合通道、下采样信息融合通道、特征融合通道;该方法包括:
基于上采样信息融合通道对目标图像的n个不同分辨率的特征图进行特征融合处理,以将低分辨率特征图的特征融合到高分辨率特征图的特征中,得到n个第一融合特征图其中n≥2,l≥1;
基于下采样信息融合通道对目标图像的n个不同分辨率的特征图进行特征融合处理,以将高分辨率特征图的特征融合到低分辨率特征图的特征中,得到n个第二融合特征图
基于特征融合通道对n个第一融合特征图ptd与n个第二融合特征图进行特征融合处理,得到n个目标特征图
可选地,n个不同分辨率的特征图按照分辨率由小到大排列。
可选地,基于上采样信息融合通道对目标图像的n个不同分辨率的特征图进行特征融合处理,以将低分辨率特征图的特征融合到高分辨率特征图的特征中,得到n个第一融合特征图包括:
基于n个不同分辨率的特征图通过如下公式:
确定n个第一融合特征其中
可选地,基于下采样信息融合通道对目标图像的n个不同分辨率的特征图进行特征融合处理,以将高分辨率特征图的特征融合到低分辨率特征图的特征中,得到n个第二融合特征图包括:
基于n个不同分辨率的特征图通过如下公式:
得到n个第一融合特征其中,
可选地,基于特征融合通道对n个第一融合特征图ptd与n个第二融合特征图进行特征融合处理,得到n个目标特征图包括:
基于n个第一融合特征图ptd与n个第二融合特征图通过如下公式:
得到n个目标特征图其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010597972.9/2.html,转载请声明来源钻瓜专利网。