[发明专利]产品检测数据集的相似度计算方法及装置在审
申请号: | 202110210120.4 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112802009A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 林大;旷黎明;师文庆;韩锦;潘正颐;侯大为 | 申请(专利权)人: | 常州微亿智造科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/46;G06K9/62 |
代理公司: | 常州至善至诚专利代理事务所(普通合伙) 32409 | 代理人: | 王颖 |
地址: | 213100 江苏省常*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品 检测 数据 相似 计算方法 装置 | ||
本申请揭示了一种产品检测数据集的相似度计算方法及装置,该方法包括根据每个缺陷在不同特征维度上的权重,计算每个缺陷在两个数据集之间的相似度K’;根据每个缺陷的相似度K’以及每个缺陷的数量占比,计算得到两个数据集之间的相似度K1;计算各个缺陷在两个数据集中数量的两个向量之间的余弦相似度,将余弦相似度与相似度K1相乘,得到两个数据集之间的相似度K2;对相似度K2进行归一化处理,得到两个数据集之间最终的相似度K。本申请采用基于缺陷各个特征维度的权重方式计算数据集的相似度,可以快速获取两个数据集的相似度,以便使用相似度较高的数据集的历史参数配置,来设定用于训练的数据集的初始参数配置,提高了模型的训练效率。
技术领域
本申请属于产品检测技术领域,涉及一种工业互联网中产品检测数据集的相似度计算方法及装置。
背景技术
基于人工智能的产品表面缺陷检测解决方案,在标注团队对所拍摄的图片进行缺陷标注后,通常需要将具有相关性的图片归到一组数据集,以供智能检测模型训练使用。
目前的模型训练方式通常是将数据集输入至模型,对模型进行训练,得到相关参数的配置信息。当需要训练的模型比较多时,由于每个模型的训练都因从零开始训练导致需要较长的时间,因此训练效率比较低。
发明内容
为了解决相关技术模型的训练效率比较低的问题,本申请提供了一种产品检测数据集的相似度计算方法及装置,技术方案如下:
第一方面,本申请提供了一种产品检测数据集的相似度计算方法,所述方法包括:
根据每个缺陷在不同特征维度上的权重,计算每个缺陷在两个数据集之间的相似度K’;
根据每个缺陷的相似度K’以及每个缺陷的数量占比,计算得到两个数据集之间的相似度K1,所述相似度K1用于刻画每个缺陷的数量占比对两个数据集相似度的贡献;
计算各个缺陷在两个数据集中数量的两个向量之间的余弦相似度,将余弦相似度与所述相似度K1相乘,得到两个数据集之间的相似度K2,所述余弦相似度用于刻画缺陷数量的结构占比,所述相似度K2用于刻画每个缺陷的数量的结构占比对两个数据集相似度的贡献;
对所述相似度K2进行归一化处理,将所述相似度K2映射到[0,1]之间,得到两个数据集之间最终的相似度K。
可选地,所述根据每个缺陷在不同特征维度上的权重,计算每个缺陷在两个数据集之间的相似度K’,包括:
对于每个缺陷,在两个数据集中分别提取所述缺陷的特征值[fi1,fi2,fi3,fi4,fi5,...fin],其中fij表示所述缺陷在第i个数据集在j维度上的特征值,n为缺陷的特征维度的总数量;
根据所述缺陷在两个数据集的特征值以及每个特征维度的权重,计算所述缺陷在两个数据集之间的相似度K’,其中,每个特征维度的权重为[w1,w2,w3,w4,w5,...,wn],K’=v1*w1+v2*w2+v3*w3+v4*w4+v5*w5+...+vn*wn,vj表示当前缺陷第j维度上的特征值在两个数据集间的相似度,且vj数值在[0,1]区间,vj=f1j/f2j。
可选地,所述根据每个缺陷的相似度K’以及每个缺陷的数量占比,计算得到两个数据集之间的相似度K1,包括:
获取每个缺陷在所述两个数据集中的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州微亿智造科技有限公司,未经常州微亿智造科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110210120.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置