[发明专利]一种基于格拉姆矩阵的动漫图像分类方法有效
申请号: | 202110415553.3 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113191406B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 卢闰霆;徐儒常;马文广;马伟;李冰;赵金 | 申请(专利权)人: | 金科智融科技(珠海)有限公司;北京工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/44;G06V10/82;G06N3/047;G06N3/0464;G06N3/045 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 519000 广东省珠海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 格拉姆 矩阵 动漫 图像 分类 方法 | ||
本发明公开了一种基于格拉姆矩阵的动漫图像分类方法。该方法设计了一种基于深度卷积神经网络和格拉姆矩阵的图像分类网络,该网络可以将输入图像分为动漫类与非动漫类。本发明具体包括如下步骤:(1)在网络上广泛搜集动漫图像和非动漫图像,建立数据集;(2)对动漫图像进行数据增广处理扩充训练数据集;(3)使用预训练的ResNet50网络提取图像的特征;(4)将所提取的特征展平并进行内积运算,从而生成包含图像风格信息的格拉姆矩阵;(5)将格拉姆矩阵输入到深度卷积神经网络中进行分类,得到输入图像是否为动漫图像的分类结果。本发明能够对动漫图像进行识别,为避免因动漫引起的侵权提供新的方案。
技术领域
本发明涉及图像识别技术领域,特别涉及一种动漫图像分类模型训练方法、动漫图像分类方法。
背景技术
随着动漫产业的快速发展,有大量的优秀动漫作品走入大众的视线,人民的精神文化生活更加的丰富多彩。在动漫产业发展的过程中,动漫产业中知识产权的运用与保护获得了前所未有的重视,但现实情况是各类动漫卡通形象被部分商业主体随意复制并发行,且相关侵权行为具有多样性。因此如何在海量数据中识别出动漫图像,进而避免相关侵权行为,是目前亟待解决的问题。
发明内容
本发明旨在从海量图像中识别出动漫图像。为此,本发明提出一种基于格拉姆矩阵的动漫图像分类模型训练方法,能够对动漫图像进行识别。
本发明还提出一种动漫图像分类方法。
第一方面,本发明的一个实施例提供了一种动漫图像分类模型训练方法,包括:
获取动漫图像样本数据;对动漫图像样本数据进行数据增广处理,得到动漫图像数据集中的动漫样本;
将在ImageNet数据集作为训练的ResNet50网络作为预训练模型,分别提取Conv3_3和Conv5_3输出的特征作为输入样本图片不同尺度下的特征,其中预训练的ResNet50网络不再参与动漫图像分类模型的训练;
将从Conv3_3和Conv5_3提取到的特征分别进行展平,并分别进行两两相乘,得到两个包含丰富纹理信息的格拉姆矩阵;
将格拉姆矩阵输入到浅层网络中进行训练,得到动漫图像分类网络;
将训练样本输入到预训练的ResNet50网络中提取图像特征,再将提取到的图像特征转换为格拉姆矩阵,送入动漫图像分类网络中进行训练,最终得到动漫图像分类模型。
本发明实施例的一种动漫图像分类模型训练方法至少具有如下优势:
1.通过对动漫图像样本数据进行数据增广处理,能够增加样本数据的多样性,提高动漫图像分类模型的泛化能力;
2.采用在ImageNet数据集上预训练的ResNet50提取输入样本特征,能够保证特征提取的丰富多样,提高从海量数据中鉴别出动漫图像的准确率。
根据本发明的另一些实施例的动漫图像分类模型训练方法,对动漫图像样本数据进行数据增广处理,得到训练、验证、测试样本,包括:
对动漫图像样本数据进行数据增强处理,得到第一样本数据;其中,
数据增强处理包含对称翻转、位移变换、随机剪裁以及添加噪声等,其中数据增强处理包含各类组合操作;
对第一样本的数据进行尺度变换操作,得到第二样本数据;
对第二样本数据进行数据分组,得到训练样本,并划分为训练集、验证集和测试集;其中,
训练集用于训练所述动漫图像分类模型;
验证集用于验证所述动漫图像分类模型收敛;
测试集用于测试所述动漫图像分类模型的动漫图像分类准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金科智融科技(珠海)有限公司;北京工业大学,未经金科智融科技(珠海)有限公司;北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110415553.3/2.html,转载请声明来源钻瓜专利网。