[发明专利]一种同款业务对象聚合、搜索的方法和系统在审
申请号: | 201310167405.X | 申请日: | 2013-05-08 |
公开(公告)号: | CN104142946A | 公开(公告)日: | 2014-11-12 |
发明(设计)人: | 邓宇;欧海峰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/54;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 对象 聚合 搜索 方法 系统 | ||
1.一种同款业务对象聚合的方法,其特征在于,包括:
获取业务对象的图像;
根据所述图像的视觉特征生成所述图像的数字签名;
采用所述图像及其对应的数字签名建立图像签名库;
依据所述数字签名将图像签名库中的图像划分为多个分组;
基于所述多个分组计算所述图像的相似度;
按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;
将属于同一图像集合的图像对应的业务对象合并为同款业务对象。
2.根据权利要求1所述的方法,其特征在于,所述根据图像的视觉特征生成所述图像的数字签名的步骤包括:
分别提取所述图像的视觉特征;所述视觉特征包括颜色特征,和/或,梯度特征,和/或,局部特征;
将所述视觉特征进行归一化,组合为对应图像的数字签名。
3.根据权利要求2所述的方法,其特征在于,
所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征时,所述分别提取图像的视觉特征的步骤包括:
获得在预设颜色空间中量化的颜色维度;
遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值距离最近的颜色维度;
统计各颜色维度在所述图像中对应的像素点个数,选择一个或多个像素点个数最多的颜色维度作为当前图像的主颜色;
获得所述主颜色在当前图像中对应的像素点个数;
和/或,
当所述视觉特征包括梯度特征时,所述分别提取图像的视觉特征的步骤包括:
将所述图像转化为灰度图像,并对所述灰度图像进行平滑;
依据所述平滑后的灰度图像计算所述图像的梯度方向直方图;
采用所述梯度方向直方图及其对应的像素点个数作为当前图像的梯度特征;
和/或,
当所述视觉特征包括局部特征时,所述分别提取图像的视觉特征的步骤包括:
提取所述图像中具有旋转不变性和尺度不变性的特征点;
计算所述特征点的对比度变量,选取对比度变量大于预设第一门限值的特征点拼接成所述图像的局部特征。
4.根据权利要求3所述的方法,其特征在于,所述依据平滑后的灰度图像计算所述图像的梯度方向直方图的子步骤进一步包括:
针对平滑后的灰度图像,计算每一像素点的梯度方向和梯度幅值;
对当前图像做梯度方向统计,生成当前图像的以梯度方向为横轴的直方图;
将所述当前图像的梯度方向平均分成R个方向角度,生成R个方向角度分别对应的R个直方图组距;其中,所述R为正整数;
遍历图像中的所有像素点,分别根据每个像素点的梯度方向找出最接近的两个方向角度对应的直方图组距,并根据接近程度从高到低分配权重系数;
将所述像素点的梯度幅值乘以权重系数分别累加至所述最接近的两个方向角度对应的直方图组距中;
进行归一化,生成当前图像的梯度方向直方图。
5.根据权利要求3或4所述的方法,其特征在于,所述依据数字签名将图像签名库中的图像划分为多个分组的步骤包括:
提取所述图像的数字签名中的颜色特征;
从所述颜色特征中提取分组主颜色;其中,所述分组主颜色包括最多像素点个数对应的主颜色;和/或,通过计算所述图像中最多像素点个数对应的主颜色的像素点数量占所述图像所有像素点数量的比例,在所述比例大于第二预设门限值时,所选取的对应像素点个数次多的主颜色;
按照所述分组主颜色将所述图像划分为多个分组,同一分组中图像的分组主颜色相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310167405.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文件分类系统及方法
- 下一篇:一种分布式数据存取方法、装置和系统