[发明专利]图片识别模型的训练方法及设备在审

申请号：	202010977452.0	申请日：	2020-09-16
公开（公告）号：	CN112132199A	公开（公告）日：	2020-12-25
发明（设计）人：	陈志远	申请（专利权）人：	上海眼控科技股份有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08
代理公司：	上海百一领御专利代理事务所(普通合伙) 31243	代理人：	王奎宇;甘章乖
地址：	200030 上海市徐汇***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图片识别模型训练方法设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明的目的是提供一种图片识别模型的训练方法及设备，本发明提出了一种量化某子空间对图片数据的合适程度的方法，从而量化了高维特征各个通道对于数据的拟合能力，增加了对高维多通道的可操作性，并成为数据选择子空间的理论依据。本发明充分挖掘了高维空间的利用率，让高维空间的特征都各自专注于某些数据，促进了多个子空间的互补能力，一定程度上成功实现了子空间的互相解耦，从而降低训练难度，提高收敛速度，并提高最终性能。

技术领域

本发明涉及计算机领域，尤其涉及一种图片识别模型的训练方法及设备。

背景技术

深度度量学习(deep metric learning)的目的是学习出一个度量空间，让语义上相似的物体在嵌入空间中的距离(度量)足够近，让语义上不相似的物体在特征空间中距离(度量)足够远。这也是大多数计算机视觉任务的共同目的，从语义上理解物体。目前的方法大都是对所有数据，学出一个统一的度量空间。利用三元组或二元组损失函数约束，让语义相同的物体的高维特征的欧式距离(L2 distance)尽可能近，不同物体的L2距离尽可能远。

大多数因为数据的方差比较大，类别巨大，所以统一的度量空间会加大训练难度，比如说动物的类别和家具的类别语义上是不一样的，所以强行用同一种度量空间来度量他们会加大训练难度。且不能充分利用巨大的高维空间。

发明内容

本发明的一个目的是提供一种图片识别模型的训练方法及设备。

根据本发明的一个方面，提供了一种图片识别模型的训练方法，该方法包括：

一种图片识别模型的训练方法，其中，该方法包括：

步骤S1，对整体数据集中的图片进行d维的特征提取，对提取出的特征进行聚类，以得到K个簇，其中，d、K为正整数；

步骤S2，计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度；

步骤S3，基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度，为每个簇匹配一个包含d维特征中的多维特征的子空间，以使每个簇各自匹配后的子空间的适合程度之和最大，其中，各个子空间所包含的各维特征互不相同；

步骤S4，遍历对整体数据集中的每张图片，对每张图片确定所属的簇，获取每张图片所属的簇对应的子空间，基于损失函数对所述每张图片进行对应子空间的图片识别模型的一轮训练，重新执行步骤S1～S4，直到各子空间的图片识别模型收敛为止。

进一步的，上述方法中，计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度，包括：

对于K个簇中的某一个簇C_k对d维的特征中的其中一维特征f_i的适合程度用如下公式进行计算：

其中，三元组(x_a,x_p,x_n)～C_k是在簇C_k中采样出的，表示在d维的特征中的第i维特征中定义的余弦距离，x_a、x_p、x_n分别表示的是整体数据集中的一张图片，整体数据集训练记为为各张图片，x_p表示的是和x_a同一类别的图片，x_n表示的是和x_a不同类别的图片。

进一步的，上述方法中，为每个簇匹配一个包含d维特征中的多维特征的子空间，包括：

基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度，将d维特征均分到每个簇。

进一步的，上述方法中，基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度，将d维特征均分到每个簇，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司，未经上海眼控科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010977452.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种肉酱灌装机
下一篇：一种复合电极的体声波谐振器及其制备方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]图片识别模型的训练方法及设备在审

专利文献下载