[发明专利]基于端到端深度集成学习网络的三维模型分类方法有效
申请号: | 201810446582.4 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108596329B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 白静;司庆龙;刘振刚 | 申请(专利权)人: | 北方民族大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 750021 宁夏回族*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 端到端 深度 集成 学习 网络 三维 模型 分类 方法 | ||
1.基于端到端深度集成学习网络的三维模型分类方法,其特征在于:该方法是采用端到端的深度学习集成策略,输入一个三维网格模型,提取多视图表征,建立包含基学习器和集成学习器的集成深度学习网络,自动提取三维模型的复合特征,完成模型分类;其包括以下步骤:
S1、选用普林斯顿刚性三维模型数据集Princeton ModelNet Dataset,分别针对ModelNet10和ModelNet40,从官网选取所需数量的模型作为训练数据和测试数据,生成训练集和数据集;
S2、对选取的三维模型进行二维视图渲染,构建给定mesh网格的多视图表征V={vi,1≤i≤N},其中N为视图数目;
S3、构建集成深度学习网络,选择所需的基学习器,并构造集成学习器;其中,所述基学习器需要完成初始决策,综合考虑三维模型库及其对应二维视图的规模及复杂性,选择CaffeNet作为面向单个二维视图分类的深度学习模型;所述集成学习器需要完成最终决策,综合集成基于各个视图的初始决策,形成对三维模型分类的最终决策,集成学习器共包含三层,第一层为集成层,后两层为全连接层,为了避免深度学习网络训练中出现过拟合,每个全连接层后有一个Dropout层;
S4、建立一个级联损失函数,有效平衡基学习器和集成学习模块的学习能力,实现复杂三维模型复合信息的有效提取;
S5、扩充训练数据,减少网络的过拟合,提高预测的鲁棒性;
S6、针对集成深度学习网络EnsembleNet的网络架构,通过基学习器预训、整体网络初训、集成学习器调优的步骤进行层次迭代式训练;
S7、利用步骤S6中的层次迭代式训练方法,得到实验所需训练样本;
S8、将训练样本输入到深度集成网络EnsembleNet,得到最后的分类准确率。
2.根据权利要求1所述的基于端到端深度集成学习网络的三维模型分类方法,其特征在于:在步骤S1中,选用Princeton ModelNet Dataset,采用官网数据,针对ModelNet10和ModelNet40分别选取3991、9843个模型作为训练数据,908、2468个模型作为测试数据,库内所有模型均按照Z轴方向正确摆放。
3.根据权利要求1所述的基于端到端深度集成学习网络的三维模型分类方法,其特征在于:在步骤S3中,所述基学习器的CaffeNet共包含9层,第一层为输入层,第二至八层为隐藏层,第九层为输出层,各层结构如下:
第一层,输入层:将通过数据增广获得的增广视图作为训练样本输入到网络;
第二层,隐藏层:包含一个卷积层、一个激活函数层、一个池化层和一个局部相应归一化层;
第三层,隐藏层:包含一个卷积层、一个激活函数层、一个池化层和一个局部相应归一化层;
第四层,隐藏层:包含一个卷积层和一个激活函数层;
第五层,隐藏层:包含一个卷积层和一个激活函数层;
第六层,隐藏层:包含一个卷积层、一个激活函数层和一个池化层;
第七层,隐藏层:包含一个全连接层、一个激活函数层和一个DropOut层;
第八层,隐藏层:包含一个全连接层、一个激活函数层和一个DropOut层;
第九层,输出层:包含一个全连接层和一个Softmax层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方民族大学,未经北方民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810446582.4/1.html,转载请声明来源钻瓜专利网。