[发明专利]一种可充分保留图像特征的特征提取模型及特征提取方法在审
申请号: | 201910865573.3 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110659653A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 刘天弼;杜姗姗;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 31204 上海德昭知识产权代理有限公司 | 代理人: | 郁旦蓉 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 操作层 池化 卷积 卷积神经网络 特征提取模型 边界填充 交替执行 目标分割 目标检测 输入图像 特征提取 特征信息 通道分离 图像分类 图像特征 语义分割 骨干网 主干网 分辨率 无损 像素 信息量 起源 抛弃 保留 应用 分析 网络 | ||
目前深度卷积神经网络的主干网都起源于最初的图像分类网络,在应用于目标检测、语义分割、目标分割等领域时,传统骨干网不断抛弃特征信息的做法导致后期分析时信息量不足。为了解决上述问题,本发明提供了一种可充分保留图像特征的特征提取模型,用于对任意分辨率的输入图像进行无损的特征提取操作,其特征在于,包括:多个卷积操作层,由通道分离卷积和1×1卷积构成;多个池化操作层,该池化操作层中池化的步长为1,边界填充以0和1像素交替执行,其中,池化操作层的数量为偶数个。
技术领域
本发明属于数字图像处理及深度学习领域,涉及机器视觉研究方向,具体涉及一种可充分保留图像特征的特征提取模型及特征提取方法。
背景技术
数字图像分析技术在当今社会发挥着重要作用,机器视觉已成为各行各业的重要研究内容。目前机器视觉技术的发展已经逐渐抛弃传统数字图像处理的手工设计算法的方案,转而使用深度学习,以卷积神经网络(Convolutional Neural Network,CNN)为代表,以达到高准确率的分析结果。然而,对于现有的CNN模型,其骨干网都起源于最初的图像分类网络,如VGG、ResNet等,在应用于目标检测、语义分割、目标分割等领域时,传统骨干网不断抛弃特征信息的做法导致后期分析时信息量不足。
卷积神经网络是一种常见的深度学习网络架构,受生物自然视觉认知机制启发而来。CNN能够得出原始图像的有效表征,这使得CNN能够直接从原始像素中,经过极少的预处理,捕获到视觉上面的规律。
目前几乎所有的深度卷积神经网络,主干网都使用图像分类网的结构,使用图像分类的特征提取方式。一方面,要求输入图像必须缩放及变形到固定大小的分辨率;另一方面,在特征提取的过程中必须经历4到5次的信息精炼提取及抛弃,这对精确信息需求迫切的网络模型来说是不合理的。因此,在一些检测、分割等复杂的图像分析领域,传统的深度卷积神经网络不能充分保留图像数据已经成为一个越来越需要解决的问题。
发明内容
为解决上述问题,提供一种不必固定输入图像分辨率,且能够充分保留图像特征的特征提取模型,本发明采用了如下技术方案:
本发明提供了一种可充分保留图像特征的特征提取模型,用于对任意分辨率的输入图像进行无损的特征提取操作,其特征在于,包括:多个卷积操作层,由通道分离卷积和1×1卷积构成;多个池化操作层,该池化操作层中池化的步长为1,边界填充以0和1像素交替执行,其中,池化操作层的数量为偶数个。
本发明提供的可充分保留图像特征的特征提取模型,还可以具有这样的技术特征,其中,特征图分辨率经传统池化操作后,分辨率降低2×2倍,之后的卷积层的卷积核大小为k×k,此卷积操作相对于池化前的可接受野为f×f,则f为:f=(k-1)×2+1,池化操作层之后衔接的卷积操作层需要以大小为f×f的卷积核执行卷积操作。
本发明还提供了一种可充分保留图像特征的特征提取方法,其特征在于,包括如下步骤:步骤D1,将特征提取模型作为卷积神经网络中用于进行特征提取的主干网,卷积神经网络用于执行点对点的预测输出;步骤D2,特征提取模型对输入图像进行特征提取得出特征数据;步骤D3,卷积神经网络直接获取特征数据并进行后续运算,其中,特征提取模型为权利要求1或2的可充分保留图像特征的特征提取模型。
发明作用与效果
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910865573.3/2.html,转载请声明来源钻瓜专利网。