[发明专利]基于深度度量学习的图片数据迭代聚类分析方法有效
申请号: | 201911305652.5 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111126470B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 秦永强;张发恩;纪双西;李素莹 | 申请(专利权)人: | 创新奇智(青岛)科技有限公司 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/774 |
代理公司: | 深圳珠峰知识产权代理有限公司 44899 | 代理人: | 黄伟 |
地址: | 266200 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 度量 学习 图片 数据 聚类分析 方法 | ||
1.一种基于深度度量学习的图片数据迭代聚类分析方法,其特征在于,包括如下步骤:
步骤S1,获取多组带有图片分类标签的样本图片数据集;
步骤S2,将各所述样本图片数据集作为一深度度量学习网络的输入,训练形成一图片嵌入特征提取器;
步骤S3,将待分析的图片数据集输入到所述图片嵌入特征提取器中,输出所述图片数据集中的每一张图片对应的图片嵌入特征向量feat;
步骤S4,根据每张所述图片对应的所述图片嵌入特征向量feat,并利用渐进式聚类算法,对所述图片数据集进行迭代聚类分析,最终输出对所述图片数据集的聚类分析结果;
所述步骤S4中,对所述图片数据集进行迭代聚类分析的过程具体包括如下步骤:
步骤S41,设定每次迭代聚类的聚类簇数目的上限m、聚类簇对应的类平均轮廓系数阈值t、每一个所述聚类簇的簇内图片数据量的上限num_max以及下限num_min和迭代计算次数itermax;
步骤S42,根据所述图片数据集中的每张所述图片对应的所述图片嵌入特征向量feat,并利用所述渐进式聚类算法,获取所述图片数据集的聚类簇;
步骤S43,计算每一个所述聚类簇中的各样本点对应的样本轮廓系数S,并根据各样本点对应的所述样本轮廓系数S计算每一个所述聚类簇对应的簇内平均轮廓系数mS;
步骤S44,基于各所述聚类簇对应的所述簇内平均轮廓系数mS、预设的所述类平均轮廓系数阈值t和所述簇内图片数据量对所述步骤S42获取的各所述聚类簇进行筛选;
步骤S45,将所述步骤S44筛选得到的各所述聚类簇中的簇内图片对应的所述图片分类标签重置为-1;
步骤S46,计算经所述步骤S45标签重置后的各所述聚类簇中的所述簇内图片的数量n;
步骤S47,根据当前的迭代聚类次数和所述步骤S46计算得到的各所述聚类簇中的所述簇内图片的数量n,调整迭代聚类分析策略,直至完成对所述图片数据集中的所有所述聚类簇中的各所述簇内图片的标签重置过程,并得到一对所述图片数据集的标签重置结果;
步骤S48,根据所述标签重置结果,对所述步骤S43计算的每个所述聚类簇对应的所述簇内平均轮廓系数mS进行更新;
步骤S49,判断更新后的所述簇内平均轮廓系数mS是否大于一预设阈值,
若是,则将所述簇内平均轮廓系数mS对应的所述聚类簇确定为有效聚类簇;
若否,则将所述簇内平均轮廓系数mS对应的所述聚类簇确定为无效聚类簇;
步骤S50,将所述步骤S49得到的判断结果作为所述聚类分析结果输出。
2.如权利要求1所述的图片数据迭代聚类分析方法,其特征在于,所述步骤S4中的所述渐进式聚类算法为K-means聚类分析算法或层次聚类法。
3.如权利要求1所述的图片数据迭代聚类分析方法,其特征在于,所述步骤S49中的所述预设阈值为0.01。
4.如权利要求1所述的图片数据迭代聚类分析方法,其特征在于,所述步骤S44中,筛选所述聚类簇的方法具体为:
当所述聚类簇对应的所述簇内平均轮廓系数mS小于预设的所述类平均轮廓系数阈值t,并且所述聚类簇内的所述簇内图片数据量大于预设的所述簇内图片数据量的上限num_max或小于预设的所述簇内图片数据量的下限num_min时,将所述聚类簇作为被筛选对象筛选出来。
5.如权利要求1所述的图片数据迭代聚类分析方法,其特征在于,所述步骤S47中,调整所述迭代聚类分析策略的具体方法过程包括如下步骤:
步骤S471,判断当前的所述迭代聚类次数是否大于或等于1且小于预设的所述迭代计算次数itermax,
若是,则进入步骤S472;
若否,则终止迭代聚类分析过程;
步骤S472,判断当前的所述迭代聚类次数是否等于1,且当前迭代聚类分析计算的所述聚类簇中的所述簇内图片的数量n是否等于所述图片数据集中的所述图片的总数量,
若是,则终止迭代聚类分析过程,并提示用户调整预设参数;
若否,则进入步骤S473;
步骤S473,判断当前迭代聚类分析计算的所述聚类簇中的所述簇内图片的数量n是否小于或等于上一次迭代聚类分析计算的同一个所述聚类簇中的所述簇内图片的数量,
若是,则进入步骤S474;
若否,则终止迭代聚类分析过程;
步骤S474,判断当前迭代聚类分析计算的所述聚类簇中的所述簇内图片的数量n是否等于上一次迭代聚类分析计算的同一个所述聚类簇中的所述簇内图片的数量,
若是,则提示所述用户减小每次迭代聚类的所述聚类簇数目的上限m,并返回所述步骤S42重新进行迭代聚类分析;
若否,则进入步骤S475;
步骤S475,判断当前迭代聚类分析计算的所述聚类簇中的所述簇内图片的数量n是否小于上一次迭代聚类分析计算的同一个所述聚类簇中的所述簇内图片的数量,
若是,则返回所述步骤S43重新进行迭代聚类分析;
若否,则终止迭代聚类分析过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(青岛)科技有限公司,未经创新奇智(青岛)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911305652.5/1.html,转载请声明来源钻瓜专利网。