[发明专利]基于神经网络自适应膨胀剪枝的视觉对象分类方法在审
申请号: | 202210824578.3 | 申请日: | 2022-07-14 |
公开(公告)号: | CN115331045A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 陈仁海;郑丽;邢猛;冯志勇 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/08 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 自适应 膨胀 剪枝 视觉 对象 分类 方法 | ||
本发明公开一种基于神经网络自适应膨胀剪枝的视觉对象分类方法,包括:运用自适应膨胀算法扩充预训练神经网络:将视觉分类图像作为输入,根据不同层对视觉对象分类任务的贡献将重要的层进行了膨胀,得到在视觉对象分类任务上符合预期的膨胀网络;采用随机结构采样算法训练膨胀网络,使膨胀网络学习为各种剪枝结构生成不同的权重;对经过随机结构采样算法训练后的膨胀网络进行剪枝,得到选择性能符合要求的网络作为压缩后的精简网络;将精简网络布置于处理设备中对视觉对象分类处理。本发明通过压缩原始网络来构建轻量化的视觉对象分类网络,使得该压缩后的精简网络在参数较少的情况下,对不同类别的视觉对象的识别准确率保持基本不变。
技术领域
本发明涉及视觉对象分类技术领域,特别是涉及一种基于神经网络自适应膨胀剪枝的视觉对象分类方法。
背景技术
对象分类主要指计算机对输入的图像进行定量分析并正确给出图像所属的类别。对象分类不仅可代替人的视觉判读,且有助于通过图片更快的搜索有用的信息。传统对象分类需要人工设计特征提取器,这需要相关人员具有丰富的专业知识和实践经验,且每种对象分类都局限于固定的图像数据,从而降低了泛化能力和鲁棒性。随着深度学习和人工智能算法的发展,基于卷积神经网络(CNN)的视觉对象分类得到了空前发展。相比于传统对象分类,基于神经网络的视觉对象分类方法依赖数据驱动,从大量样本的学习中提取各种类别的特征表示,可有效提高对象分类的准确率,甚至可以超越人眼的识别水平。
因此,基于神经网络的视觉对象分类方法有望广泛应用于生产生活。例如在车辆驾驶过程中,安全是最重要的。但由于人眼视觉视角的限制,在行车过程中会存在视觉盲区,尤其在注意力不集中的时候还可能会引发事故,基于神经网络的视觉对象分类可时刻准确地将行车过程中各个方向存在的行人、交通信号灯、车辆等对象识别并反馈给驾驶员,驾驶员只需根据路况做出行驶决策。其次,在医疗领域目前对各种医学图像(X照肺部图片等)的诊断都是由医学专家人工筛查,但专家水平的差异可能会导致有些病情不能被及时发现;此外,很多地方医院由于专业人才的缺失导致许多患者不得不异地就医,这不仅影响医院的声誉,且意味着患者要付出更多额外开销,甚至有些患者因为各种原因不能及时得到治疗。基于神经网络的视觉对象分类不仅可辅助专家对是否患病以及病情严重程度进行诊断,且地方医院只需购入相关设备就可方便当地居民。
但目前由于视觉对象分类网络模型参数过于庞大,对硬件内存和计算资源的消耗很大,且模型预测时间较长,难以应用于实践。尽管目前已经有学者针对这一问题提出了不同的网络压缩方案,但现有的通道修剪方法有两个局限性:首先,Rethinking-network-pruning已经证明CNN模型的结构将决定模型的性能,而不是继承的“重要”权重。但是,目前通道剪枝方法是在原始网络的基础上去除通道,因此剪枝网络是原始网络的一个子结构。换句话说,原始网络中每一层的通道数限制了剪枝网络的多样性。其次,Visualizing andUnderstanding指出网络的不同层之间存在功能差异,这导致层间权重的Lp范数存在显着差异。但是,基于全局重要性(例如L2范数)约束去除通道的修剪方法倾向于在Lp范数较低的层中去除更多的通道,因此得到的剪枝网络的结构是唯一的,进一步限制了剪枝网络的多样性。
总之,目前基于神经网络的视觉对象分类方法虽然达到了不俗的精度,但局限于实验室的理想环境。在实际工程应用中,由于资金、设备性能等的限制,无法直接将复杂度高、具有大量参数神经网络投入到对象识别应用系统中。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于神经网络自适应膨胀剪枝的视觉对象分类方法,旨在解决基于神经网络的视觉对象分类算法复杂度高、检测时间长、压缩后的精简网络结构单一的问题。
为实现本发明的目的所采用的技术方案是:
一种基于神经网络自适应膨胀剪枝的视觉对象分类方法,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210824578.3/2.html,转载请声明来源钻瓜专利网。