[发明专利]一种基于卷积神经网络的服装图像分类与检索方法及系统在审
申请号: | 201910492484.9 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110210567A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 张瑞华 | 申请(专利权)人: | 广州瑞智华创信息科技有限公司;张瑞华 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 彭伶俐;丁彦峰 |
地址: | 511495 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 特征向量 检索 服装图像 检索图像 余弦相似度 几何变换 模型提取 图像分类 不变性 鲁棒性 分类 形变 准确率 构建 光照 图像 应用 | ||
本发明实施例公开了一种基于卷积神经网络的服装图像分类与检索方法,通过构建并训练的深层卷积神经网络模型提取待检索图像的特征向量,并将待检索图像的特征向量与建立的特征向量库中的特征向量进行余弦相似度对比,能够高效准确的检索出与待检索图像相同或最相似的几张图像,由于卷积神经网络对几何变换、形变、光照具有一定程度的不变性,因此该方法能够极大地提高图像分类与检索的准确率,应用于服装图像检索中,便捷高效并具有较高的鲁棒性。
技术领域
本发明实施例涉及图像识别技术领域,具体涉及一种基于卷积神经网络的服装图像分类与检索方法及系统。
背景技术
随着服装电子商务的发展,服装图像的分类和检索技术也在逐步更新以适应客户不断变化的需求。传统的图像检索方法是通过关键字或文本来检索服装图像,其实质是以文搜图,随着服装图像数量的增长,该方法的缺点越来越显著。首先,关键字只能描述易于提取的、抽象的语义特征,并不能全面地反映服装图像的视觉特征,尤其是一些精细的、难以描述的特征;其次,由于图像数量巨大,需要花费大量的人力物力进行人工标注,而且人工标注容易产生主观偏差;最后,如果用户输入的搜索关键词描述不够准确,则难以检索到想要的商品。
而随着图像处理技术的发展,出现了以图搜图技术,即输入一张图像可以返回多张相同或相似的图像列表。目前的基于以图搜图的服装图像分类和检索方法得到的结果并不是十分理想,特别是当图像中存在复杂的背景或者图像质量不高时,检索结果往往不能令人满意。现有的以图搜图的图像检索方法多是基于对图像内容特征进行检索,如图像全局的颜色、形状、纹理等特征或者局部的兴趣点、角点等特征,存在以下缺陷:(1)针对服装的颜色特征、形状特征或纹理特征采用何种低级视觉特征,如何选择分类器都是根据经验选择,很难保证最佳检测效果;(2)识别计算比较耗时,效率不高;(3)用特定的方法识别服装,一般只能在特定场景下应用,鲁棒性比较差,实用价值低;(4)这种方法对于实际实施现场中会比较繁琐,造成应用成本上升。
发明内容
为此,本发明实施例提供一种基于卷积神经网络的服装图像分类与检索方法及系统,以解决现有的服装图像检索方法准确率低、检测效率不高、应用性差的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明实施例的第一方面,提出了一种基于卷积神经网络的服装图像分类与检索方法,所述方法包括:
将带有类别信息的服装图像数据集分割为训练集和验证集;
构建卷积神经网络模型;
使用所述训练集对所述卷积神经网络模型进行训练;
使用所述验证集对训练后的所述卷积神经网络模型进行验证;
使用所述卷积神经网络模型提取所述服装图像数据集中图像的特征向量,并建立特征向量库;
使用所述卷积神经网络模型提取待检索图像的特征向量;
将所述待检索图像的特征向量与所述特征向量库中的特征向量使用余弦相似度进行一一比对,输出所述服装图像数据集中与所述待检索图像最相似的前多张图像。
进一步地,所述卷积神经网络模型包括依次连接的第一卷积层、第一ReLU激活层、第二卷积层、第二ReLU激活层、第三卷积层、第三ReLU激活层、第四卷积层、第四ReLU激活层、第五卷积层、第五ReLU激活层、平均池化层和全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州瑞智华创信息科技有限公司;张瑞华,未经广州瑞智华创信息科技有限公司;张瑞华许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910492484.9/2.html,转载请声明来源钻瓜专利网。