[发明专利]一种基于无标注自动特征提取的大规模电商图片检索系统在审
申请号: | 201711265073.3 | 申请日: | 2017-12-05 |
公开(公告)号: | CN107958067A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 张杰;李仁勇;崇志宏 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙)32249 | 代理人: | 陈建和 |
地址: | 210003 江苏省南京市高新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于无标注自动特征提取的大规模电商图片检索系统,包含三个模块特征提取模块,检索模块、以及图像数据库;特征提取模块特征提取模块包含图像预处理和特征提取;先进行图像预处理操作,对原始图像进行缩放和裁剪到相同的图像大小;特征提取部分为基于深度神经网络的特征提取方式,提出使用一种无监督的深度模型作为图片的特征提取器;判别网络接受真实图像数据和伪造数据作为输入并判别输入数据真伪,使用对抗训练交替优化两个网络,最后使用判别网络中的卷积层输出作为图像特征;对提取的原始特征在存储到图像数据库和检索之前进行特征降维,本系统使用机器学习中的PCA降维方法。 | ||
搜索关键词: | 一种 基于 标注 自动 特征 提取 大规模 图片 检索系统 | ||
【主权项】:
基于无标注自动特征提取的大规模电商图片检索系统,其特征是系统包含三个模块:特征提取模块,检索模块、以及图像数据库;特征提取模块:特征提取模块包含两个部分,图像预处理和特征提取;由于输入的图像受到图像格式和图像像素大小的影响,先进行图像预处理操作;在本系统中图像预处理部分是对原始图像进行缩放和裁剪到相同的图像大小;对于单通道的灰度图将其转化为三通道的RGB三色图;并将0~255RGB值归一化到‑0.5~+0.5区间;特征提取部分为基于深度神经网络的特征提取方式,提出使用一种无监督的深度模型作为图片的特征提取器;深度模型由两个深度神经网络组成,采样网络从随机噪声中采样生成与真实图片类似的伪造图片;判别网络接受真实图像数据和伪造数据作为输入并判别输入数据真伪,使用对抗训练交替优化两个网络,最后使用判别网络中的卷积层输出作为图像特征;检索模块:对提取的原始特征在存储到图像数据库和检索之前进行特征降维,本系统使用机器学习中的PCA降维方法;进行检索时,将查询图像与数据库中所有图像匹配,计算图像特征间的欧几里得距离和夹角余弦距离,然后按距离排序返回检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711265073.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种文档全自动拼接方法及系统
- 下一篇:一种基于实体知识库的语言模型平滑方法