[发明专利]模型训练方法、对象识别方法及装置、存储介质在审
申请号: | 202010529203.5 | 申请日: | 2020-06-11 |
公开(公告)号: | CN113807122A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 王栋;刘梓墨;王双;戚赟炜;邓玉明 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陶丽;栗若木 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 对象 识别 装置 存储 介质 | ||
1.一种模型训练方法,其特征在于,包括:
获取图像采集装置采集的图像,根据获取的图像建立多组样本集合;
对获取的图像进行关联处理,获得多个视频片段,根据所述视频片段和样本集合建立单组样本对集合,利用所述单组样本对集合训练单组距离模型,所述单组距离模型用于计算属于相同样本集合的两个样本之间的距离;
根据所述单组距离模型和样本集合,建立第一跨组样本对集合和第二跨组样本对集合,所述第一跨组样本对集合包括多个第一跨组样本对,所述第一跨组样本对包括属于不同样本集合的第一样本和第二样本,且所述第一样本和第二样本互为在对方所在样本集合中搜索到的与自身距离最近的样本;所述第二跨组样本对集合包括多个第二跨组样本对,所述第二跨组样本对包括属于不同样本集合的第三样本和第四样本,且所述第三样本和第四样本中的一个为在自身所在样本集合中搜索到的与所述第三样本和第四样本中的另一个距离最近的样本;
利用单组样本对集合和第一跨组样本对集合初始化训练跨组距离模型,利用第二跨组样本对集合继续训练所述跨组距离模型直至所述跨组距离模型训练完成,所述跨组距离模型用于计算属于不同样本集合的两个样本之间的距离。
2.根据权利要求1所述的模型训练方法,其特征在于,所述根据获取的图像建立多组样本集合,包括:
将所述获取的图像缩放至预设像素值;
提取缩放后的图像的多维特征向量;
对提取的多维特征向量进行降维;
将降维之后的特征向量存储为所述样本集合中的样本。
3.根据权利要求1所述的模型训练方法,其特征在于,一个所述图像采集装置采集的图像对应一组或多组所述样本集合。
4.根据权利要求1所述的模型训练方法,其特征在于,所述单组样本对集合包括正样本对集合和负样本对集合;所述根据所述视频片段和样本集合建立单组样本对集合,包括:
将属于相同视频片段的任意两个样本作为一个正样本对,一组样本集合对应的多个正样本对组成该组样本集合对应的正样本对集合;
将属于不同视频片段的任意两个样本作为一个负样本对,一组样本集合对应的多个负样本对组成该组样本集合对应的负样本对集合。
5.根据权利要求1所述的模型训练方法,其特征在于,所述单组距离模型和跨组距离模型均为跨视图二次鉴别分析距离模型。
6.一种模型训练装置,其特征在于,包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至5任意一项所述的模型训练方法的步骤。
7.一种存储介质,其特征在于,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任意一项所述的模型训练方法的步骤。
8.一种对象识别方法,其特征在于,包括:
获取待识别图像;
利用预先训练的跨组距离模型,对待识别图像进行对象识别,所述跨组距离模型的训练样本集包括初始训练样本集和二次训练样本集,所述初始训练样本集包括单组样本对集合和第一跨组样本对集合,所述二次训练样本集包括第二跨组样本对集合,所述第一跨组样本对集合包括多个第一跨组样本对,所述第一跨组样本对包括属于不同样本集合的第一样本和第二样本,且所述第一样本和第二样本互为在对方所在样本集合中搜索到的与自身距离最近的样本;所述第二跨组样本对集合包括多个第二跨组样本对,所述第二跨组样本对包括属于不同样本集合的第三样本和第四样本,且所述第三样本和第四样本中的一个为在自身所在样本集合中搜索到的与所述第三样本和第四样本中的另一个距离最近的样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010529203.5/1.html,转载请声明来源钻瓜专利网。