[发明专利]群体度量学习分类方法、系统、计算机设备及存储介质在审

申请号：	202210895024.2	申请日：	2022-07-28
公开（公告）号：	CN115310525A	公开（公告）日：	2022-11-08
发明（设计）人：	张利强;刘亦书;黄涌波;韩政卓	申请（专利权）人：	华南师范大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	李君
地址：	510631 广东省广州市天河***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	群体度量学习分类方法系统计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种群体度量学习分类方法、系统、计算机设备及存储介质，所述方法包括：获取图像数据集；搭建三胞胎网络，所述三胞胎网络有三个输入，分别用于输入锚点样本、正样本和负样本；从图像数据集中构建锚点样本数据集、正样本数据集和负样本数据集，作为三胞胎网络的输入，使用多类N对中心损失函数训练三胞胎网络，实现群体度量学习，所述多类N对中心损失函数是根据多类N对损失函数改进的损失函数；利用训练好的三胞胎网络对待测图像进行分类。本发明采用的多类N对中心损失函数可以通过联合群体样本，弥补了现有方法的扩展问题和采样问题，较之现有损失函数，能够充分利用所有的数据以及提高模型训练时的稳定性。

技术领域

本发明涉及一种群体度量学习分类方法、系统、计算机设备及存储介质，属于计算机视觉领域。

背景技术

凭借压倒性的性能优势，目前深度学习已经成为很多领域的主流方法。小(单)样本学习领域也不例外，其优秀模型大都是深度神经网络。这些方法可以分成三种：网络微调法、循环神经网络记忆法和度量学习法，三者各有千秋，没有一种方法明显优于其它方法。

在人脸识别、指纹识别等开集分类的任务中，数据集类别数往往很多而每个类的样本数却比较少，在这种情况下基于深度学习的分类方法常表现出一些局限性，如缺少类内约束、分类器优化困难等。

度量学习旨在解决上述这些局限性，具体实现步骤：对于两个样本x_i和x_j，搭建深度学习神经网络并由特定的损失函数训练网络，学习到样本到特征的映射f_θ(·)，在该映射下，样本特征间的距离度量d_(i,j)(通常为欧式距离||f_θ(x_i)-f_θ(x_i)||₂)便可以反映样本间的相似程度：相似程度高的类内(同类)样本对应的特征距离更近，反之，相似程度低的类间(不同类)样本对应的特征距离更远。

度量学习法中损失函数的典型代表是Hadsell提出的对比损失(contrastiveloss)、Schultz提出的三元组损失(triplet loss)、Song提出的提升结构化损失(liftedstructured loss)和Sohn提出的多类N元组损失(多类N对损失函数)。其中，最晚出现的多类N元组损失表现最为突出，其损失函数采样策略如图1所示。在阐述之前，有一些基本概念需要说明：1)锚点样本(anchor example)：用于构建正样本和负样本的基准样本；2)正样本(positive example)：与锚点样本同属一类的样本；3)负样本(negative example)：与锚点样本不同属一类的样本；4)正样本对(anchor-positive)：锚点样本和正样本组成的二元组；5)负样本对(anchor-negative)：锚点样本和负样本组成的二元组。

Sohn将对比损失和三元组收敛比较慢的原因归结于训练时每次只挖掘一个负样本，缺少了与其他负样本的交互过程。基此原因，他提出了多类N元组损失(多类N对损失函数)：假设训练时一个mini-batch中包含N类样本，则对于某一个锚点样本，联合1个正样本和N-1个负类样本，目的是实现正样本对的相似度显著高于所有负样本对的相似度。

每个训练批次mini-batch涉及N类图像、2N张图像列表x＝(x₁，x₂，…，x_2N)，其中x_2i-1(i∈{1，2，…，N})与x_2i属于同类，则损失函数可定义为：

其中，f表示样本到特征的映射f_θ(·)，f_i^Tf_j⁺和f_i^Tf_i⁺分别表示负样本对和正样本对的余弦相似度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南师范大学，未经华南师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210895024.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于智能识别的语音平台电力灾情预警方法
下一篇：工程设备的巡航控制方法、装置和车联网云平台

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]群体度量学习分类方法、系统、计算机设备及存储介质在审

专利文献下载