[发明专利]支持多任务和跨任务的小样本分类训练方法及装置在审

申请号：	202011133629.5	申请日：	2020-10-21
公开（公告）号：	CN112200262A	公开（公告）日：	2021-01-08
发明（设计）人：	黄美玉;向雪霜;徐遥	申请（专利权）人：	中国空间技术研究院
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京善任知识产权代理有限公司 11650	代理人：	张振伟
地址：	100094 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	支持任务样本分类训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种支持多任务和跨任务的小样本分类训练方法，其特征在于，所述方法包括：

将小样本分类问题中的分类任务转换为标准分类问题中的样本，并将小样本分类的目标形式转换为给定大量任务样本的情况下学习的任务解决器；

模拟标准分类问题中的批训练处理方式，每次迭代处理每个类别中的一些样本，采用多任务的小样本分类训练算法，每次迭代处理多个任务类别中的一些任务样本；

模拟标准分类问题中的预训练处理方式，在大规模数据上为类似小规模数据任务预先训练基本模型，采用跨任务的小样本分类训练算法，在多类别问题上为小类别问题预先训练基本模型，并利用预先训练基本模型对小类别问题进行微调。

2.根据权利要求1所述的方法，其特征在于，所述将小样本分类的目标形式转换为给定大量任务样本的情况下学习的任务解决器，包括：

对于标记训练数据集上的监督学习问题，该问题具有如下的目标函数：

其中，f_θ是具有参数集θ的特定网络，l是给定的损失函数；

对于定义在具有M个类别、每个类别具有H个样本的训练集上的标准分类问题，其中是D维的输入向量，y_i∈{1，2，…，M}是类别标号，D_j代表集合D中所有y_i＝j的样本(x_i,y_i)集合，f_θ是需要学习的分类器，通用的损失函数l(f_θ；x_i,y_i)是交叉熵，如下式(2)所示：

其中f_θ(x_i)_j代表f_θ(x_i)的第j个输出；

考虑在所述训练集D上的K-way S-shot学习问题，定义任务类别为包含M个类别中的K个索引的类别子空间V∈T，将每个任务类别V中的任务样本G(V):＝{(τ_i,y_i)}定义为支撑集S_V和对应的查询集Q_V中查询样本(x_i,y_i)的组合；假定RANDOMSAMPLE(C,N)表示从集合C中无放回地随机均匀采样N个样本，则V＝RANDOMSAMPLE({1,…,M},K)，每个任务样本(τ_i,y_i)被表示成(τ_i＝{S_V,x_i},y_i)，其中(x_i,y_i)＝RANDOMSAMPLE(Q_V,1)，

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

l(f_θ；τ_i,y_i)为原型网络的损失函数时，则有：

l(f_θ；τ_i,y_i)＝l(f_θ；S_V,x_i,y_i)＝-log p_θ(y＝y_i|S_V,x_i)(5)

其中，d:为距离函数；在给定τ_i＝{S_V,x_i}的情况下，式(5)表示的损失函数与式(2)表示的标准分类问题中的交叉熵损失相对应。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国空间技术研究院，未经中国空间技术研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011133629.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]支持多任务和跨任务的小样本分类训练方法及装置在审

专利文献下载