[发明专利]卷积神经网络适用于识别多种尺寸图片的方法有效
申请号: | 201510966515.1 | 申请日: | 2015-12-21 |
公开(公告)号: | CN105389596B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 袁家劼 | 申请(专利权)人: | 长沙网动网络科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 席小东 |
地址: | 410013 湖南省长沙市高新开发区*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 卷积神经网络 分类识别 模型架构 整数倍 模型拓展 缩放处理 图片分割 图形识别 智能识别 连接层 小像素 构建 图片 | ||
1.一种卷积神经网络适用于识别多种尺寸图片的方法,其特征在于,包括以下步骤:
步骤1:已知一种用于识别w*h尺寸样本的可训练的卷积神经网络模型架构;其中,将w*h尺寸样本记为样本C1,w为样本C1的长度;h为样本C1的宽度;已知可训练的卷积神经网络模型架构的模型架构参数均已知,特别包括以下模型架构参数:在输入层之后的第1个卷积层中,包括的特征图数量为n,第1卷积层所采用的卷积核尺寸为m*m;其中,n和m均为自然数;
步骤2:设待分类识别的样本的原始尺寸为W*H;其中,W为待分类识别样本的原始长度;H为待分类识别样本的原始宽度;
对待分类识别样本的长和宽分别进行缩放处理,以损失最小像素为代价,将待分类识别样本的原始长度缩放到样本C1长度的整数倍,将待分类识别样本的原始宽度缩放到样本C1宽度的整数倍,将缩放后得到的样本记为样本C2;设样本C2的长度为样本C1长度的x倍;设样本C2的宽度为样本C1宽度的y倍;其中,x和y均为整数;
步骤3,对样本C2进行图片分割处理,将其分割为x*y个子图,每个子图的长为w,宽为h;
步骤4,将x*y个子图依次记为子图D
对于子图D
对于子图D
依此类推
直到对于子图D
然后,合并特征图a
合并特征图a
依此类推
直到合并特征图a
至此,得到n个特征图,分别为特征图E1、特征图E2…特征图En;
此时可以看到,所得到的特征图E1、特征图E2…特征图En的尺寸与已知可训练的卷积神经网络模型架构的第1个卷积层的特征图尺寸相等;所得到的特征图E1、特征图E2…特征图En的数量与已知可训练的卷积神经网络模型架构的第1个卷积层的特征图数量相等;
步骤5,构建新的卷积神经网络模型架构,其中,所述新的卷积神经网络模型架构的第1层为输入层,用于输入尺寸为W*H的待分类识别的样本;
新的卷积神经网络模型架构的第2层为图片分割层,为步骤3划分得到的x*y个长宽为w和h的子图,即:子图D
新的卷积神经网络模型架构的第3层为第1卷积层,为步骤4计算合并到的n个特征图,即:特征图E1、特征图E2…特征图En;
此外,子图D
新的卷积神经网络模型架构的第4层为已知可训练的卷积神经网络模型架构的第2层;
新的卷积神经网络模型架构的第5层为已知可训练的卷积神经网络模型架构的第3层;
依此类推,已知可训练的卷积神经网络模型架构的后续模型架构参数对应增加到新的卷积神经网络模型架构的对应层,直到将已知可训练的卷积神经网络模型架构的输出层增加到新的卷积神经网络模型架构的输出层为止;
由此构建得到新的卷积神经网络模型架构,该构建新的卷积神经网络模型架构对于尺寸为W*H的样本必然是可训练和可收敛的。
2.根据权利要求1所述的卷积神经网络适用于识别多种尺寸图片的方法,其特征在于,步骤2中,以损失最小像素为代价,将待分类识别样本的原始长度缩放到样本C1长度的整数倍,即x倍;将待分类识别样本的原始宽度缩放到样本C1宽度的整数倍,即y倍,具体为:
x值为:W除以w的整数商;y值为:H除以h的整数商;
或者:
x值为:W除以w的值进行四舍五入后得到的整数;
y值为:H除以h的值进行四舍五入后得到的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙网动网络科技有限公司,未经长沙网动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510966515.1/1.html,转载请声明来源钻瓜专利网。