[发明专利]基于端到端深度集成学习网络的三维模型分类方法有效
申请号: | 201810446582.4 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108596329B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 白静;司庆龙;刘振刚 | 申请(专利权)人: | 北方民族大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 750021 宁夏回族*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 端到端 深度 集成 学习 网络 三维 模型 分类 方法 | ||
本发明公开了一种基于端到端深度集成学习网络的三维模型分类方法,该方法是采用端到端的深度学习集成策略,输入一个三维网格模型,提取多视图表征,建立包含基学习器和集成学习器的集成深度学习网络,自动提取三维模型的复合特征,完成模型分类。实验表明,本发明方法在ModelNet10、ModelNet40、SHREC10、SHREC11、SHREC15数据集上分别取得了96.04%、92.79%、98.33%,98.44%and98.63%的分类精度。这一结果明显优于其它多视图分类算法,也初步验证了本方法的有效性。
技术领域
本发明涉及计算机图形学、计算机视觉与智能识别的技术领域,尤其是指一种基于端到端深度集成学习网络(EnsembleNet)的三维模型分类方法。
背景技术
当前,随着三维建模、扫描及计算机视觉等领域的不断发展,无人驾驶、三维场景漫游、智慧城市建设等相关技术的研究和应用受到了人们的广泛关注。其中,三维模型的有效识别正是其中的基础性研究问题。
特征的构造和分类模型的选取是决定分类优劣的关键。特别是对于三维模型这类复杂的数据类型,合适特征的建立更是相关领域研究人员的关注热点,也是业界的研究难点。深度学习技术能让机器自动学习客观对象的多层抽象和表示,从而理解复杂对象的内在含义,自动完成本质特征的提取,为三维模型的检索带来了新的研究方向。
由于深度学习要以结构化数据或有序数据为输入,而三维模型的网格表示无法满足需求。因此,学者们最初想到的方法就是首先提取三维模型的简单统计特征,将三维模型转化为一组向量,再以此为输入,构建深度学习网络以完成最终特征提取和分类。典型的工作有以Zernike矩和热核特征为输入的深度学习方法。由于深度学习的突出优点就是能够完成特征的自学习;而这类方法在输入向量数据时已经进行了一次初级特征的提取,难免丢失三维模型的原始信息,无法充分利用深度学习特征自学习的优点,影响深度学习效果。
针对以上方法存在的缺陷,学者们开始寻找新的三维模型原始表征方法.Wu等(WuZ,Song S,Khosla A,et al.3D shapenets:A deep representation for volumetricshapes[C]//Proceedings of the IEEE Conference on Computer Vision and PatternRecognition.Washington DC:IEEE Computer Society Press.2015:1912‐1920)在2015年首次提出了基于体素的三维深度信念网络3DShapenets,在ModelNet10和ModelNet40标准数据集上分别取得了83.54%,77.32%的分类准确率,较传统方法高出3‐5个百分点.此后,D.Maturana等(Maturana D,Scherer S.Voxnet:A 3D convolutional neural networkfor real‐time object recognition[C]//Proceedings of Intelligent Robots andSystems.Washington DC:IEEE Computer Society Press,2015:922‐928)提出了基于三维体素的卷积神经网络VoxNet,将ModelNet10和ModelNet40标准数据集上的分类准确率提高到92%和83%.Andrew等(Brock A,Lim T,Ritchie J M,et al.Generative anddiscriminative voxel modeling with convolutional neural networks[J].arXivpreprint arXiv:1608.04236(2016))则于2016年提出了基于VAE的深度学习模型,将ModelNet10和ModelNet40上的分类精度提高到97.14%和95.54%的新高度.总体而言,基于体素的深度学习方法在近几年取得了突出的成绩.然而,由于体素数据维度高,信息较为稀疏,以体素为输入的深度学习网络在准确率和资源耗费方面很难做到平衡.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方民族大学,未经北方民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810446582.4/2.html,转载请声明来源钻瓜专利网。