[发明专利]一种基于F-CDSSD的衣物识别与分类方法在审
申请号: | 201910303272.1 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110738230A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 赵宏伟;张卫山;于强 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 衣物 图像 神经网络模型 训练数据集 迭代学习 计算平台 模糊处理 模糊理论 模型检测 神经网络 数据增强 网络结构 主动学习 传统的 复杂度 特征图 纵横比 卷积 拟合 替换 输出 引入 分类 清晰 优化 网络 | ||
本发明提出了一种基于F‑CDSSD的轻量级衣物识别分类方法,包括如下内容:采用数据增强技术,解决训练数据集过小的问题,避免过拟合现象;将传统的VGG‑16网络进行替换为ShuffleNet并且对各个卷积层输出的特征图进行模糊处理,降低了网络结构的复杂度,使之可以在轻型计算平台上运行;调整default box的大小、纵横比和数量,提高了神经网络的精度和效率;针对不清晰的图像引入模糊理论,提高了对低质量衣物图像的识别精度;实现了主动学习和迭代学习,充分利用模型检测结果,实现了神经网络模型的不断优化。
技术领域
本发明涉及物联网、基于深度学习的衣物识别与分类、主动学习、模糊理论、并发执行和缓存技术,具体涉及到一种基于F-CDSSD的衣物识别与分类方法。
背景技术
近几年,深度学习得到了飞速的发展,把目标检测和分类推到了一个新的高度。卷积神经网络对于目标的几何变换、形变、光照等因素适应性较强,有效克服了由于衣物外观多变带来的识别阻力。它可根据输入到网络的数据自动地生成相应特征的描述,具有较高的灵活性和普适性。目前图像中的目标检测主要分为single-stage方法(如SSD,YOLO)和two-stage方法(如RCNN系列)两种。Single-stage方法直接在图片上经过计算生成检测结果。Two-stage方法先在图像上提取候选区域,再基于候选区域进行特征提取然后再进行预测。相对来说single-stage速度快,精度低,而two-stage精度高,速度慢。
YOLO作为深度学习中利用single-stage方法进行目标检测的先驱,首次提出了直接将目标检测转化为回归问题,用整张图片得到边界框和目标类别的思路。以YOLO为主体并加以改进提出的SSD增加了对多尺度目标的检测,很大程度上解决了YOLO难以检测小目标、定位不准等问题。但是SSD算法中存在过多比例不合适的default box,这样在后续的回归中会造成很大的计算量的浪费;SSD中传统的VGG-16网络结构所得到的神经网络对于轻型ARM计算平台而言,结构过于庞大,难以在轻型计算设备上运行;同时对于相对模糊的图像识别效果较差。
本方法采用基于F-CDSSD的轻型衣物识别与分类方法,通过数据增强技术对训练数据集进行扩充,解决训练集过小的问题;将主体神经网络替换为轻型的ShuffleNet,使之能够在轻量级计算平台上平稳运行;在模型训练过程中将default boxes根据图像中衣物的特点进行调整,加快模型训练速度,提升模型的准确型;将得到的视频数据加上基于一系列的语言规则(IF-THEN)或选择合适的成员函数(三角函数、梯形函数、高斯函数等)模糊预处理操作,从而生成模糊输入集,将视频数据输入神经网络,经得到特征图模糊化,然后再做衣物类别判断和边框回归;此外,引入了主动学习和迭代学习的思想,将检测到的图像以及生成的标注经过校验之后加入到神经网络的优化中,对于新的衣物可以保证有较高的准确率。
发明内容
为解决现有技术中的缺点和不足,本发明提出了一种新的衣物检测方法。首先对采集到的图像进行数据增强处理,将训练数据集进行扩充;在网络主体结构上,将传统的VGG-16网络结构替换为一种更为轻型的卷积神经网络,最大程度上降低神经网络的复杂度,得到一种新的神经网络F-CDSSD;在训练时,对初始default boxes的尺寸和纵横比进行了调整,提升了对于衣物识别的准确率和速度;引入模糊理论,解决图像不清晰时准确率偏低的问题;采用主动学习和迭代学习的思想,实现神经网络模型的自优化。
本发明的技术方案为:
步骤(1)、采集衣物的图像数据,在将图像进行筛选和人工标注后通过数据增强技术扩充数据量,并部分图像进行模糊处理制作用于训练神经网络模型的数据集;
步骤(2)、修改defaultboxes的纵横比和大小,将主体神经网络更换后进行神经网络的训练,并对得到的特征图进行模糊化处理,得到衣物识别分类神经网络模型F-CDSSD;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910303272.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序