[发明专利]图片识别模型的训练方法及设备在审
申请号: | 202010977452.0 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112132199A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 陈志远 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 识别 模型 训练 方法 设备 | ||
本发明的目的是提供一种图片识别模型的训练方法及设备,本发明提出了一种量化某子空间对图片数据的合适程度的方法,从而量化了高维特征各个通道对于数据的拟合能力,增加了对高维多通道的可操作性,并成为数据选择子空间的理论依据。本发明充分挖掘了高维空间的利用率,让高维空间的特征都各自专注于某些数据,促进了多个子空间的互补能力,一定程度上成功实现了子空间的互相解耦,从而降低训练难度,提高收敛速度,并提高最终性能。
技术领域
本发明涉及计算机领域,尤其涉及一种图片识别模型的训练方法及设备。
背景技术
深度度量学习(deep metric learning)的目的是学习出一个度量空间,让语义上相似的物体在嵌入空间中的距离(度量)足够近,让语义上不相似的物体在特征空间中距离(度量)足够远。这也是大多数计算机视觉任务的共同目的,从语义上理解物体。目前的方法大都是对所有数据,学出一个统一的度量空间。利用三元组或二元组损失函数约束,让语义相同的物体的高维特征的欧式距离(L2 distance)尽可能近,不同物体的L2距离尽可能远。
大多数因为数据的方差比较大,类别巨大,所以统一的度量空间会加大训练难度,比如说动物的类别和家具的类别语义上是不一样的,所以强行用同一种度量空间来度量他们会加大训练难度。且不能充分利用巨大的高维空间。
发明内容
本发明的一个目的是提供一种图片识别模型的训练方法及设备。
根据本发明的一个方面,提供了一种图片识别模型的训练方法,该方法包括:
一种图片识别模型的训练方法,其中,该方法包括:
步骤S1,对整体数据集中的图片进行d维的特征提取,对提取出的特征进行聚类,以得到K个簇,其中,d、K为正整数;
步骤S2,计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度;
步骤S3,基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,为每个簇匹配一个包含d维特征中的多维特征的子空间,以使每个簇各自匹配后的子空间的适合程度之和最大,其中,各个子空间所包含的各维特征互不相同;
步骤S4,遍历对整体数据集中的每张图片,对每张图片确定所属的簇,获取每张图片所属的簇对应的子空间,基于损失函数对所述每张图片进行对应子空间的图片识别模型的一轮训练,重新执行步骤S1~S4,直到各子空间的图片识别模型收敛为止。
进一步的,上述方法中,计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,包括:
对于K个簇中的某一个簇Ck对d维的特征中的其中一维特征fi的适合程度用如下公式进行计算:
其中,三元组(xa,xp,xn)~Ck是在簇Ck中采样出的,表示在d维的特征中的第i维特征中定义的余弦距离,xa、xp、xn分别表示的是整体数据集中的一张图片,整体数据集训练记为为各张图片,xp表示的是和xa同一类别的图片,xn表示的是和xa不同类别的图片。
进一步的,上述方法中,为每个簇匹配一个包含d维特征中的多维特征的子空间,包括:
基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,将d维特征均分到每个簇。
进一步的,上述方法中,基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,将d维特征均分到每个簇,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010977452.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种肉酱灌装机
- 下一篇:一种复合电极的体声波谐振器及其制备方法