[发明专利]一种基于卷积神经网络的服装属性识别方法在审
申请号: | 202111197537.8 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113920315A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 潘如如;向军;高卫东 | 申请(专利权)人: | 江南大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/24;G06V10/74;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 张勇 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 服装 属性 识别 方法 | ||
本发明涉及服装图像识别领域,涉及一种基于卷积神经网络的服装属性识别方法。服装属性识别方法步骤如下:第一步,候选区的提取;第二步,对数据集中的矩形区域和标注区域内的图像进行预处理;第三步,候选区的特征提取和分类;第四步,对预选框定位精度进行衡量;第五步,校正识别区域。本发明通过对服装图像的局部特征识别其属性,提高了识别效率和精确度。
技术领域
本发明涉及服装图像识别领域,涉及一种基于卷积神经网络的服装属性识别方法。
背景技术
随着电子商务的流行和图像据的累计,如何从庞大的图像数据中快速挖掘出有用的信息成为一个迫切的需求并迅速成为一个研究热点。服装类目作为电商行业中的第一大类目,其需求更是迫切。针对服装图像分类任务,传统的方法是借助数字图像处理以及模式识别,通过对图像局部分割和特征提取等基于底层视觉特征或者手工设计的视觉特征来实现对服装图像的识别,这些基于底层特征的方法过于依赖特征提取,具有一定的局限性。
随着近期深度学习在图像分类识别任务上的突破,越来越多的深入学习的方法被用来解决服装图像分类和识别,这些方法虽能大大提高识别效率,但都是从图片整体上去识别其分类或属性,而很多服装的一些属性从局部就能辨别,因此通过图像局部识别的方法可以大大提高识别效率。
发明内容
本发明的目的是为了从庞大的图像数据中快速挖掘出有用的信息,从服装图像的局部特征区域来识别衣服的一些特征,提高服装图像识别的效率和精确度。
本发明的技术方案如下:
一种基于目标检测算法框架的服装属性识别方法,步骤如下:
第一步,候选区的提取;
优选地,本发明采用选择性搜索算法(Search Selective,后文简称SS算法)提取候选区区域。步骤如下:
首先使用基于图的分割方法将图像分割成许多小区域,然后通过各个区域间的颜色、纹理、尺寸、吻合度之间地相似性进行区域合并,得到每个可能存在的目标的矩形框,如附图2所示。
相比于原始SS算法,本发明使用不同通道的颜色矩来表示图像颜色特征,通过调整基于图的分割算法中的尺度和阈值来控制预选框的提取效果。
另外,根据所选的服装款式类型,结合服装各个属性的分类,尽量用一个最小的区域去框选目标特征区域,得到各个特征区域的标注实例,以此作为训练和测试模型的主要数据集。
第二步,对数据集中的矩形区域和标注区域内的图像进行预处理;
优选地,所述图像预处理,步骤如下:
由于后续的模型需要输入图像的尺寸一致,因此需要对SS算法得到的矩形框和标注的数据进行尺寸的归一化处理。本发明采用双线性插值对图像进行放缩处理,放缩系数由矩形框中比较长的一边进行决定,段边上的空白用全0进行填充,放缩实例如附图7所示。
第三步,候选区的特征提取和分类;
优选地,在进行特征提取的时候,本发明选取卷积神经网络对选区进行特征提取,并且在网络架构中使用Inception结构。其示意图如附图3所示,其中(a)中所示的结构主要作用是对空间特征进行聚合,(b)中所示结构除了聚合作用外,还可以降低特征图尺寸。
优选地,在进行预测图像分类时,本发明选取L-Softmax分类器。
在卷积神经网络中,最大熵损失是最常用的监督分量。尽管该组件很简单且很受欢迎,但它并没有明确鼓励对特性的判别式学习。本研究应用广义大边界最大损失(L-Softmax),明确地鼓励了类间的可分性和类内特征之间的紧密性。
在进行候选区的特征提取和分类的步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111197537.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗菌防静电耐磨橡胶地板材料
- 下一篇:一种电子商务交易大数据云平台