[发明专利]一种基于深度卷积神经网络模型-重生网络的视觉识别方法在审

专利信息
申请号: 202011185864.7 申请日: 2020-10-30
公开(公告)号: CN112257800A 公开(公告)日: 2021-01-22
发明(设计)人: 蔡志成;庄建军;彭成磊 申请(专利权)人: 南京大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈建和
地址: 210093 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 卷积 神经网络 模型 重生 网络 视觉 识别 方法
【说明书】:

基于深度卷积神经网络模型‑重生网络的视觉识别方法,采用“重生机制”的“重生模块”搭建一种新型深度卷积神经网络模型,引入的重生机制对被ReLU函数截断死亡的神经元进行重生再造,“重生机制”的实现流程:在重生网络中,引入并实现重生机制的模块称为重生模块;首先,重生模块的输入x为上层卷积层得到的特征映射,先将x输入传统的ReLU函数,得到激活后的特征映射x1,这样就筛选出取值为正的神经元,并截断负值的神经元;同时,将输入x取反,并行地将‑x输入ReLU函数,得到激活后的特征映射x2*,这样就筛选出取值为负的神经元,并截断正值的神经元;对取值为负的神经元进行筛选后,对它们进行逆卷积操作,然后与正值进行通道级联,就是负神经元的重生过程。

技术领域

发明涉及一种新型且具有高性能的深度卷积神经网络模型,属于人工智能,尤其是深度卷积神经网络模型-重生网络(RebornNet)视觉识别方法,深度学习和计算机视觉领域,可用于图像识别、图像分类等任务,也可作为物体检测、语义分割、图像生成、风格迁移等任务的基准模型。

背景技术

卷积神经网络(Convolutional Neural Network,CNN)是一种前馈型的神经网络,其在大型图像处理方面有出色的表现。卷积操作实质:输入图像(input volume),在深度方向上由很多slice组成,对于其中一个slice,可以对应很多神经元,神经元的weight表现为卷积核的形式,即一个方形的滤波器(filter)(如3X3),这些神经元各自分别对应图像中的某一个局部区域(local region),用于提取该区域的特征。如果该slice对应的神经元参数共享,那么相当于只有一个卷积核作用于所有的局部区域(类似于图像滤波了)。一个局部区域可以称为一个block,如果将所有的block拉成一个个列向量(因为神经元作用本来就定义为将输入向量和参数向量进行内积操作,y=w0x0+w1x1+...+wnxn),则我们可以得到很多这些列向量组成的局部区域数据矩阵,再将神经元的weight拉成一个个行向量,这样就得到一个参数矩阵(如果参数共享,那么该矩阵行数为slice的个数),然后将数据矩阵和参数矩阵进行点积操作,得到卷积后结果,其实就是将所有的filter和所有的局部区域分别进行点积操作,当然这个结果还需要重新reshape到期望的输出尺寸。这个过程其实也解释了为什么神经元的参数可以保存在一个个filter中,该网络层为什么称为卷积层。参数共享的卷积操作使得卷积神经网络具有平移不变形的特征。对于浅层的卷积层学到较小的图像特征(如边缘、纹理、色度);深层的卷积层将学习到更为抽象的特征(如猫的耳朵形状、眼睛纹理等)

CNN通过分层进行信息抽象,随着网络层数的增加,抽象层级也增加。更深的网络层能学习到更复杂的表达。

另有区域卷积神经网络(R-CNN),全称是Region-CNN,是第一个成功将深度学习应用到目标检测上的算法。R-CNN基于卷积神经网络(CNN),线性回归,和支持向量机(SVM)等算法,实现目标检测技术。但是这个问题并没有想象的那么简单,首先物体的尺寸变化很大,物体摆放的角度不同,形态各异,而且可以出现在图片的任何地方,有些物体还具有多个类别。R-CNN主要就是用了做目标检测任务的。先简单了解下目标检测,通俗理解是对于给定图片精确的找到物体所在的位置,将其用矩形边框框出,并且标注物体的类别(一张图像中含有一个或多个物体)。图1中,输入:image;输出:类别标签(Category label);位置(最小外接矩形/Bounding Box),模型构思:按分类问题对待可分为两个模块:

·模块一:提取物体区域(Region proposal)

·模块二:对区域进行分类识别(Classification)

主要难度是:在提取区域上需要面临位置不同;需要检测的对象大小不一,过小的对象由于特征较为模糊,不易被检测出来;需要提取对象数量过多;对象拥挤或受到遮挡而造成漏检;非极大值抑制将近邻对象抑制等问题。在分类识别方面主要面对CNN分类计算量大,语义信息不够丰富,分类不够准确等问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011185864.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top