[发明专利]一种生成学生网络模型的方法有效

专利信息
申请号: 202010243249.0 申请日: 2020-03-31
公开(公告)号: CN111291836B 公开(公告)日: 2023-09-08
发明(设计)人: 宫禄齐;徐勇军;李超 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06V10/774 分类号: G06V10/774;G06V10/764;G06V10/82;G06N3/0442;G06N3/0464;G06N3/0475;G06N3/082;G06N3/084
代理公司: 北京泛华伟业知识产权代理有限公司 11280 代理人: 王勇
地址: 100190 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 生成 学生 网络 模型 方法
【权利要求书】:

1.一种生成学生网络模型的方法,学生网络模型应用于图像识别领域,其特征在于,所述方法包括下述步骤:

步骤1)、获取预训练的教师网络模型;

步骤2)、构建辅助网络模型,设定所述辅助网络模型的输入为表征其各层网络结构的嵌入向量,所述辅助网络模型的输出为表征学生网络模型结构的参数,所述辅助网络模型的各层分别与所述学生网络模型中的待训练层对应;

步骤3)、对所述辅助网络模型初始化,利用初始化的辅助网络模型生成学生网络模型,学生网络模型包括卷积层、全连接层和Softmax分类器;

步骤4)、将带有图像标签的训练图像分别输入到所述学生网络模型和所述教师网络模型,所输入的图像数据经过辅助网络生成的学生网络模型产生的卷积层得到图像对应的特征图、图像对应的特征图经全连接层的权重的处理得到全连接层的输出,全连接层的输出经Softmax分类器的处理得到图像的分类概率作为检测结果,基于所述学生网络模型的检测结果以及图像标签计算标签损失,基于学生网络模型的检测结果和教师网络模型的检测结果计算逻辑层损失,并将相应损失返回到所述辅助网络模型中,对所述辅助网络模型的结构进行迭代调整,直至收敛;

步骤5)、根据得到的所述辅助网络模型生成所述学生网络模型。

2.根据权利要求1所述的方法,其特征在于,所述步骤2)包括生成元输入和查找表,所述元输入包括若干个独热编码向量,所述查找表将每个独热编码向量与一种表示网络层结构的嵌入向量表示相对应。

3.根据权利要求2所述的方法,其特征在于,所述辅助网络模型初始化包括随机生成若干所述独热编码向量,将各个独热编码向量所对应的表示网络结构的嵌入向量表示输入至所述辅助网络模型中的相应层。

4.根据权利要求1所述的方法,其特征在于,对所述辅助网络模型的结构进行迭代调整包括对辅助网络模型各层的权重参数以及嵌入向量的权重参数进行调整。

5.根据权利要求1所述的方法,其特征在于,步骤4)中所计算的损失包括学生网络模型输出与教师网络模型输出交叉熵Lossstu_tea以及学生网络模型输出与原始标签交叉熵Lossstu_label

6.根据权利要求1所述的方法,其特征在于,所述方法包括:

训练过程中,将每个迭代批次的图像特征输入教师网络模型,所输入的图像数据经过预训练后的教师网络模型生成预测结果ytea

ytea=TeaNet(ImgFea,tea_weights)

将每个迭代批次的图像特征输入学生网络模型,生成预测结果ystu

ystu=StuNet(InputImages,stu_weights);

根据下式计算学生网络模型输出的损失Loss:

Loss=αLossstu_tea+βLossstu_label

=L(ystu,ytea)+β(ystu,Label)

其中,β为调和因子,函数L公式如下:

7.根据权利要求6所述的方法,其特征在于,所述方法包括:根据损失函数,利用反向传播方法分别利用下述公式对所述辅助网络模型以及嵌入向量的权重参数进行优化直至收敛,公式如下:

其中,η为学习率,φ为所述辅助网络模型或嵌入向量的当前权重参数,φ′为所述辅助网络模型或嵌入向量更新后的权重参数。

8.根据权利要求1-7中任意一项的方法,其特征在于,所述方法包括,随机生成不同的嵌入向量分别输入至所述辅助网络模型,生成不同的学生网络模型,使用演化算法利用验证数据集挑选最优的学生网络模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010243249.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top