[发明专利]基于熵损失函数的离散化可微分神经网络搜索方法在审
申请号: | 202010479378.X | 申请日: | 2020-05-29 |
公开(公告)号: | CN111767983A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 刘畅;田运杰;焦建彬;叶齐祥 | 申请(专利权)人: | 中国科学院大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/901;G06F16/903 |
代理公司: | 北京康思博达知识产权代理事务所(普通合伙) 11426 | 代理人: | 潘炜;刘冬梅 |
地址: | 100049 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 损失 函数 离散 微分 神经网络 搜索 方法 | ||
1.一种基于熵损失函数的离散化可微分神经网络搜索方法,其特征在于,所述方法包括以下步骤:
步骤1,构建搜索空间;
步骤2,配置搜索阶段的搜索策略;
步骤3,进行搜索训练,获得目标网络。
2.根据权利要求1所述的搜索方法,其特征在于,步骤1中,所述构建的搜索空间为基于单元的超网络搜索空间,记为O,其中的每个元素为一个固定的操作,记为o(*)。
3.根据权利要求2所述的搜索方法,其特征在于,在每个单元内部,不同边的输出采用下式获得:
其中,fi,j(zi)表示i节点到j节点的输出特征;zi表示第i个节点;表示边(i,j)的操作o(*)上的结构权重;
α为对每个操作赋予的结构参数,即操作权重;
节点的输出采用下式获得:
zj=∑i<jbi,j·fi,j(zi)
Zj表示第j个节点,β表示对每条连接节点的边赋予的结构参数,即边权重;bi,j表示边权重经过softmax操作后的值。
4.根据权利要求1所述的搜索方法,其特征在于,步骤2包括以下子步骤:
步骤2-1,根据待搜索得到的网络结构配置,设置搜索条件;
步骤2-2,根据训练数据集,选择控制因子类型,确定搜索策略。
5.根据权利要求4所述的搜索方法,其特征在于,步骤2-1中,所述设置搜索条件包括构建熵损失函数,
所述熵损失函数包括边的熵损失函数和操作的熵损失函数,
其中,边的熵损失函数如下式所示:
i、j为节点序号;N为每个节点保留的输入边数;B={βi,j|i<j,βi,j0},且βi,j≤1。
6.根据权利要求5所述的搜索方法,其特征在于,设置熵最小值点为bi,j之中存在N个值为1/N,其余为0。
7.根据权利要求4所述的搜索方法,其特征在于,步骤2-2中,所述搜索策略通过下式获得:
L(θ,α,β)=LC(α,θ)+λc(λαLo(α)+λβLE(β))
其中,λc,λα,λβ是正则化控制因子,分别控制分类损失项、操作离散化损失项和边离散化损失项;LC(α,θ)为分类损失函数,θ,α,β分别为网络权值、操作权重和边权重;LO(α)和LE(β)分别为操作的熵损失函数和边的熵损失函数。
8.根据权利要求1所述的搜索方法,其特征在于,步骤3包括以下子步骤:
步骤3-1,划分训练数据集;
步骤3-2,优化网络结构参数;
步骤3-3,对网络进行离散化,获得目标网络。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有可微分神经网络搜索程序,所述程序被处理器执行时,使得处理器执行权利要求1至8之一所述基于熵损失函数的离散化可微分神经网络搜索方法的步骤。
10.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有可微分神经网络搜索程序,所述程序被处理器执行时,使得处理器执行权利要求1至8之一所述基于熵损失函数的离散化可微分神经网络搜索方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大学,未经中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479378.X/1.html,转载请声明来源钻瓜专利网。