[发明专利]一种基于粒子群算法的深度卷积神经网络架构搜索方法有效
申请号: | 202011281112.0 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112381226B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 张超超;刘小波;杨健峰;周志浪 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62;G06N3/00;G06N3/04 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 王佩 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粒子 算法 深度 卷积 神经网络 架构 搜索 方法 | ||
1.一种基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:具体包括以下步骤:
S101:构建基于结构块的卷积神经网络架构;
S102:构建形状为(2,8,2)的三维数组,将所述卷积神经网络架构编码为粒子;
数组第一维代表卷积神经网络架构两种类型的块,分别为正常块和降维块;
数组的第二维表示每个块中的4个中间节点的8个元素;
数组的第三维由运算类型在OP中所对应的索引和运算的节点组成;
S103:根据粒子在图像验证集上的分类精度计算粒子的适应值,得到粒子个体历史最优解pBest和粒子种群历史最优解gBest;
S104:根据粒子个体历史最优解pBest和粒子种群历史最优解gBest,更新粒子群,并判断是否达到终止条件,若是,则得到最优的卷积神经网络架构,否则跳转至步骤S103。
2.如权利要求1所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述基于结构块的卷积神经网络架构,由三个块组成,包括两个正常块和一个降维块。
3.如权利要求2所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:每个块由两个输入节点、四个中间节点、一个输出节点的有序序列组成。
4.如权利要求3所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:
所述两个输入节点的输入分别为当前块的前一个块、前二个块输出节点的输出;
每个中间节点的输出由该中间节点之前的任意两个节点经过运算之和的输出;
所述输出节点的输出为四个中间节点的级联输出。
5.如权利要求4所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:
步骤S102中,所述形状为(2,8,2)的三维数组,具体含义为:
三维数组的第一维,表示2种块,分别为正常块和降维块;
三维数组的第二维,表示每个块中,四个中间节点对应的8个元素,每个元素在数组中具有索引;
每个所述元素,由对应中间节点输出过程中运算节点和运算节点之间的运算类型共同构成;所述运算类型存放于运算操作OP列表中;
三维数组的第三维,表示运算类型在OP列表中的索引和对应的运算节点。
6.如权利要求5所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:步骤S104更新粒子群时,策略为基于粒子中的元素更新,其具体为:
将粒子的更新转化为对粒子中的元素进行逐个更新;
逐个求解两个粒子的元素E1与E2之差E1-E2;
逐个求待更新元素的速度;
粒子中所有元素基于元素之差和给定元素速度逐个完成更新,最终达到粒子更新。
7.如权利要求6所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述两个粒子的元素E1与E2之差,具体为,如果元素E1、E2相同,则元素之差为None,表示两个元素没有差异,否则元素之差为E1。
8.如权利要求7所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述给定元素速度,其计算过程具体为:
根据[0,1)之间的随机数r与预设的常数因子cg之间的大小关系,从给定元素P_E与粒子个体历史最优解pBest和粒子种群历史最优解gBest相同索引的的元素之差gBest_E-P_E和pBest_E-P_E中选择;
若[0,1)之间的随机数r小于等于预设的常数因子cg,则给定元素P_E的速度为gBest_E-P_E;否则,元素P的速度为pBest_E-P_E。
9.如权利要求8所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:粒子中所有元素基于元素之差和给定元素速度逐个完成更新,最终达到粒子更新,具体过程为:
S201:对于任一粒子P,逐个求解P与粒子个体历史最优解pBest和粒子种群历史最优解gBest相同索引的元素之差,分别为gBest_E-P_E和pBest_E-P_E;
S202:根据[0,1)之间的随机数r与预设的常数因子cg之间的大小关系,得到待更新元素P_E的速度;
若[0,1)之间的随机数r小于等于预设的常数因子cg,则给定元素P_E的速度为gBest_E-P_E;否则,为pBest_E-P_E;
S203:根据待更新元素P_E的速度,对元素P_E进行更新,如果其速度为None,则元素P_E保持不变,否则用其速度将其替换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011281112.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种异构环签名方法
- 下一篇:一种线上学习方法及装置、电子设备及存储介质