[发明专利]一种用于小样本学习的双流卷积神经网络在审
申请号: | 202210596920.9 | 申请日: | 2022-05-30 |
公开(公告)号: | CN115019089A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 朱徽;赵晓芳 | 申请(专利权)人: | 中科苏州智能计算技术研究院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/46;G06V10/80;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈忠辉 |
地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 样本 学习 双流 卷积 神经网络 | ||
本发明揭示了一种用于小样本学习的双流卷积神经网络,包含基于主流网络和辅助流网络各自的特征向量嵌入及相似度评分,并进一步分数融合。利用小样本图像分类的训练集构建支持集和查询集,在卷积神经网络中引入辅助流嵌入网络,提取主要目标的显著特征,并与主流网络的整体嵌入特征相融合。应用本发明该双流卷积神经网络后,面对小样本学习场景,提高了用于特征嵌入的卷积神经网络的合理性、稳定性和整体辨识力,进而提高了小样本学习中训练结果的准确率。
技术领域
本发明涉及一种改进型卷积神经网络,尤其涉及一种用于小样本学习的双流卷积神经网络。
背景技术
深度学习凭借卷积神经网络的优异性能,在计算机视觉领域取得了巨大的成功。然而,训练卷积神经网络需要大量的有标签数据,获取有标签数据的过程往往是困难的和昂贵的。同时,对于深度学习,有限的标记数据很容易导致过拟合。已有研究发现,人类视觉系统可以利用先前的知识,在一次接触数据后通过少量的样本来学习一个新的概念。在给定有限有标签样本的情况下,学习属于未曾见过类别的无标签样本的问题称为小样本学习。例如,小孩子只需要少量书中图片,就可以对斑马、犀牛等高准确率地外形辨认。由此,小样本学习希望模型在学习一定类别的大量数据后,对于新类别,只需要少量样本就能快速学习。
为了从有监督信息的有限样本中学习知识,研究人员提出了大量改进小样本学习性能的方法,如参考资料[1, 2, 3, 4, 5, 6, 7]所揭示。最具代表性的,基于度量学习的小样本学习方法通过嵌入函数将赝本表征在一个共同的特征空间中,再通过预定义的距离度量方法进一步识别嵌入向量所属的具体类别。
然而,在研究和使用小样本学习技术的过程中发现,现有的小样本方法由于包含大量干扰信息,特别是杂乱的背景,容易产生效果不佳的嵌入特征表示。虽然通过大量的训练迭代和其他正则化技巧可以缓解这个问题,但嵌入向量中未能突出主要目标不可避免地会对结果造成负面影响。如图1所示,支持集左侧第一列的原始图片,为三只在绿色草地上的小狗,而查询图片为绿色草地上一只小猫,则分类结果可能会出现同类的误判;而从左侧第二列的前景图片来看,支持集中的小狗与查询图片的小猫差距明显,因此能得到“不同类”这一准确的分类结果;另一方面,支持集右侧第二列的原始图片,为三只蓝天白云下的鸟类,而查询图片为落爪于枯木的一只鸟,但背景是绿色为主的青山翠树,则分类结果也会出现不同类的误判;而从右侧第一列的前景图片来看,支持集和查询图片均为鸟类,因此得到“同类”的分类结果。由此可见,背景干扰可能会导致来自不同(或相同)类别的样本被错误地划分为相同(或不同)类别。
参考文献的著录信息列举如下:
[1] Chelsea Finn, Pieter Abbeel, and Sergey Levine, “Model-agnosticmeta-learning for fast adaptation of deep networks,” in ICML, 2017.
[2] Kwonjoon Lee, Subhransu Maji, Avinash Ravichandran, and StefanoSoatto, “Meta-learning with differentiable convex optimization,” in CVPR,2019.
[3] Flood Sung, Yongxin Yang, Li Zhang, Tao Xiang, Philip H. S. Torr,and Timothy M. Hospedales, “Learning to compare: Relation network for few-shot learning,” in
CVPR, 2018.
[4] Oriol Vinyals, Charles Blundell, Tim Lillicrap, KorayKavukcuoglu, and Daan Wierstra, “Matching networks for one shot learning,” inNeurIPS, 2016.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科苏州智能计算技术研究院,未经中科苏州智能计算技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210596920.9/2.html,转载请声明来源钻瓜专利网。