[发明专利]一种层次化视觉多层感知机的图像识别分类方法在审
申请号: | 202310173528.8 | 申请日: | 2023-02-28 |
公开(公告)号: | CN116385767A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 赖申其;钱炜;杨政;何晓飞 | 申请(专利权)人: | 杭州飞步科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/44;G06N3/045;G06N3/048 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 层次 视觉 多层 感知 图像 识别 分类 方法 | ||
1.一种层次化视觉多层感知机的图像识别分类方法,其特征在于:
1)建立一个带有层次化的视觉多层感知机的感知神经网络;
2)将图像输入到感知神经网络中分类识别处理,获得图像的类别分类。
2.根据权利要求1所述的一种层次化视觉多层感知机的图像识别分类方法,其特征在于:所述的感知神经网络包括连续依次进行的一个卷积层和四个感知模块,前两个感知模块包含有用于提取局部特征的紧凑区域多层感知机,后两个感知模块包含有用于汇聚全部特征的紧凑区域多层感知机。
3.根据权利要求2所述的一种层次化视觉多层感知机的图像识别分类方法,其特征在于:第一个感知模块仅只由一个紧凑区域多层感知机构成,第二个感知模块是由一个卷积层和一个紧凑区域多层感知机构成,第三个感知模块和第四个感知模块是由一个卷积层和一个稀疏区域多层感知机构成。
4.根据权利要求2所述的一种层次化视觉多层感知机的图像识别分类方法,其特征在于:所述的紧凑区域多层感知机是将将输入自身的特征图I依次经过通道全连接层、紧凑区域全连接层、通道全连接层和归一化操作得到感知特征图I’,将输入的特征图I和感知特征图I’相加得到最终的输出特征图O。
5.根据权利要求2所述的一种层次化视觉多层感知机的图像识别分类方法,其特征在于:所述的稀疏区域多层感知机是将将输入自身的特征图I依次经过通道全连接层、稀疏区域全连接层、通道全连接层和归一化操作得到感知特征图I’,将输入的特征图I和感知特征图I’相加得到最终的输出特征图O。
6.根据权利要求4所述的一种层次化视觉多层感知机的图像识别分类方法,其特征在于:所述的紧凑区域全连接层,具体按照以下方式处理:
S1、将输入自身的特征图在空间维度上进行紧凑切分得到(H/CS)*(W/CS)个、长和宽均为CS的紧凑局部区域;
S2、对每个紧凑局部区域进行平均池化得到(H/CS)*(W/CS)个紧凑局部特征块;
S3、对每个紧凑局部特征块经空间全连接层处理得到(H/CS)*(W/CS)个紧凑增强特征块;
S4、对每个紧凑增强特征块进行最近邻上采样,使长和宽重新变为H和W,得到局部区域特征块。
S5、对所有局部区域特征块进行sigmoid激活函数的处理得到局部区域权重,将局部区域权重和原始输入自身的特征图进行加权操作得到紧凑区域全连接层输出的特征图。
7.根据权利要求5所述的一种层次化视觉多层感知机的图像识别分类方法,其特征在于:所述的稀疏区域全连接层,具体按照以下方式处理:
S1、将输入自身的特征图在空间维度上进行稀疏切分得到(H/CS)*(W/CS)个、长和宽均为CS的稀疏全局区域;
S2、对每个稀疏全局区域进行平均池化得到(H/CS)*(W/CS)个稀疏全局特征块;
S3、对每个稀疏全局特征块经空间全连接层处理得到(H/CS)*(W/CS)个稀疏增强特征块;
S4、对每个稀疏增强特征块进行最近邻上采样,使长和宽重新变为H和W,得到全局区域特征块。
S5、对所有局部区域特征块进行sigmoid激活函数的处理得到全局区域权重,将局部区域权重和原始输入自身的特征图进行加权操作得到稀疏区域全连接层输出的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州飞步科技有限公司,未经杭州飞步科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310173528.8/1.html,转载请声明来源钻瓜专利网。