[发明专利]一种层次化视觉多层感知机的图像识别分类方法在审
申请号: | 202310173528.8 | 申请日: | 2023-02-28 |
公开(公告)号: | CN116385767A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 赖申其;钱炜;杨政;何晓飞 | 申请(专利权)人: | 杭州飞步科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/44;G06N3/045;G06N3/048 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 层次 视觉 多层 感知 图像 识别 分类 方法 | ||
本发明公开了一种层次化视觉多层感知机的图像识别分类方法。建立一个带有层次化的视觉多层感知机的感知神经网络,将图像输入到感知神经网络中分类识别处理,获得图像的类别;所述的感知神经网络包括连续依次进行的一个卷积层和四个感知模块,第一个感知模块仅只由一个紧凑区域多层感知机构成,第二个感知模块是由一个卷积层和一个紧凑区域多层感知机构成,第三个感知模块和第四个感知模块是由一个卷积层和一个稀疏区域多层感知机构成。本发明的视觉多层感知机结构具备全局感受野,方法既能捕获局部特征,也能捕获全局特征,并可以在下游任务上取得较好结果。
技术领域
本发明涉及计算机视觉技术领域的一种图像分类方法,涉及神经网络结构设计、图像分类、图像检测及其装置,具体而言是涉及了一种层次化视觉多层感知机的图像识别分类方法。
背景技术
视觉感知机是最近1年刚提出的新方法,相比视觉变压器(Vision Transformer),其实现简单,能更好的被硬件支持,且同样能达到较好的效果。在图像分类、目标检测、语义分割、图像处理等多个领域中都有不俗表现。
MLP-Mixer(MLP-Mixer:An all-MLP Architecture for Vision,NeurIPS 2021)是第一个提出这个概念的工作,但是其只能在分类任务上使用,无法将预训练权重迁移到其他任务上,不能作为一个通用的视觉骨干网络。
Shift-T(When Shift Operation Meets Vision Transformer:An ExtremelySimple Alternative to Attention Mechanism,AAAI 2022)
AS-MLP(AS-MLP:An Axial Shifted MLP Architecture for Vision,ICLR 2022)
CycleMLP(CycleMLP:A MLP-like Architecture for Dense Prediction,ICLR2022)
Hire-MLP(Hire-MLP:Vision MLP via Hierarchical Rearrangement,CVPR2022)
之后的一些方法,采用特征局部偏移的方法,从而捕捉空间信息,并使得网络可以迁移到下游任务中,但是现有技术的这些方法均只能获得局部信息,感受野较小,效果并不理想。
发明内容
为了解决背景技术中存在的问题,本发明提出了一种层次化的视觉多层感知机结构及其的图像识别分类方法。
所述的视觉多层感知机结构具备全局感受野,其既能捕获局部特征,也能捕获全局特征,并可以在下游任务上取得较好结果。
本发明采用的技术方案是:
1)建立一个带有层次化的视觉多层感知机的感知神经网络;
2)将图像输入到感知神经网络中分类识别处理,获得图像的类别分类。
所述的感知神经网络包括连续依次进行的一个卷积层和四个感知模块,前两个感知模块包含有用于提取局部特征的紧凑区域多层感知机,后两个感知模块包含有用于汇聚全部特征的紧凑区域多层感知机。
第一个感知模块仅只由一个紧凑区域多层感知机构成,第二个感知模块是由一个卷积层和一个紧凑区域多层感知机构成,第三个感知模块和第四个感知模块是由一个卷积层和一个稀疏区域多层感知机构成。
所述的紧凑区域多层感知机是将将输入自身的特征图I依次经过通道全连接层、紧凑区域全连接层、通道全连接层和归一化操作得到感知特征图I’,将输入的特征图I和感知特征图I’相加得到最终的输出特征图O。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州飞步科技有限公司,未经杭州飞步科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310173528.8/2.html,转载请声明来源钻瓜专利网。