[发明专利]一种基于轻量级深度学习网络的文物分类方法在审
申请号: | 202111167627.2 | 申请日: | 2021-10-07 |
公开(公告)号: | CN113920363A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 张绍泽;任磊;汪霖;邢天璋 | 申请(专利权)人: | 中国电子科技集团公司第二十研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06N3/04 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 顾潮琪 |
地址: | 710068 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轻量级 深度 学习 网络 文物 分类 方法 | ||
本发明提供了一种基于轻量级深度学习网络的文物分类方法,首先构建面向文物图像分类的数据集,然后使用本发明设计的粗粒度聚类神经网络把原始文物图像数据集划分为若干个相对独立的小数据集,针对每个小数据集使用本发明设计的轻量级神经网络分类器对数据进行分类,最后,利用能量预测模型来度量该CNN模型能否部署于资源有限的设备上。本发明能够简化模型结构,加快训练速度,可复用性更强,能够更好地平衡精度与计算量,适合在资源有限的设备上部署。
技术领域
本发明属于人工智能技术领域,涉及深度学习领域,特别是一种文物图像分类方法,旨在为博物馆提供基于图像的高精度和稳定的文物分类。
背景技术
文物图像的高效自动分类是文物图像大数据的关键技术之一。目前国内各大博物馆网站主要通过关键字来检索图像,首先需要对文物图像进行手工标注。随着文物图像数量的急剧增加,该人工方式将带来极大的成本。因此,利用人工智能技术对文物的类型进行智能判别,将文物归入相应条目,能够大大提高文物分类效率,提高博物馆文物资源的管理水平。温超等人(温超,屈健,李展.融合深度特征的多示例学习陶俑图像分类[J].西北大学学报(自然科学版),2019,49(6):895-902.)提出了一种结合深度特征与多示例学习的陶俑文物图像分类方法,但该方法需要用到手工特征,不能完全用神经网络自动提取特征。Chen等人(Chen SX,Han X,Gao WZ,Liu XX,Mo BF.A classification method of oraclematerials based on local convolutional neural network framework[J].IEEEComputer Graphics and Applications,2020,40(3):32-44.)提出了一种基于多区域卷积神经网络的甲骨文拓印分类方法,但该模型框架主要部署于服务器端,其参数量多、计算量大,难以部署于资源有限的设备上。深度学习在分类等应用领域具有很强的性能,但由于现有的绝大多数卷积神经网络(Convolutional neural networks,CNN)模型的结构复杂、参数多,并且存在严重的时延和能耗等问题,难以将其直接部署于资源有限的设备上。如何设计轻量级深度学习模型并将其成功部署于资源有限的设备上是一个十分具有挑战的问题。Howard等人(Howard AG,Zhu M,Chen B,Kalenichenko D,Wang W,Weyand T,Andreetto M,Adam H.Mobilenets:efficient convolutional neural networks for mobile visionapplications[J].arXiv,2017:1704.04861.)提出了MobileNet V1深度可分离卷积,其本质是对冗余信息进行稀疏化表达,但其结构过于简单,导致网络的性价比不高。
发明内容
为了克服现有技术的不足,本发明提供一种基于轻量级深度学习网络的文物分类方法,以实现用于文物分类的CNN模型在增强现实等边缘计算平台上的高精度部署。
本发明解决其技术问题所采用的技术方案包括以下步骤:
S1,构建面向文物图像分类的原始图像数据集;
S2,使用粗粒度聚类神经网络模型将原始数据集划分成k个小数据集;利用所构建的原始图像数据集对粗粒度聚类模型进行监督训练;
S3,分别训练与k个小数据集相对应的分类器,获得k个分类器;将原始图像数据集作为分类器的输入,根据分类器输出特征得到文物图像中文物类别的判别结果;
S4,利用能量预测模型来预测深度学习模型能否成功部署于资源有限的设备上,其中,代表整个神经网络的计算量,和分别表示第j个卷积层的输入通道数和输出通道数,第j个卷积层的输入特征图大小为K为卷积核大小,n为整个神经网络的卷积层数,R表示与计算量相关的能量消耗,α为计算量和能量消耗的转换因子;将R值与资源有限设备的最大能耗进行比较,若设备最大能耗大于R则转至步骤S5,否则转至步骤S2,调整超参数α以及监督训练中标准卷积和深度可分离卷积输入输出通道维数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十研究所,未经中国电子科技集团公司第二十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111167627.2/2.html,转载请声明来源钻瓜专利网。