[发明专利]基于嵌入流形表征和信息瓶颈约束的图像检测方法在审
申请号: | 202211682208.7 | 申请日: | 2022-12-27 |
公开(公告)号: | CN115830398A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 张丽清;潘子琦;张健夫;招浩华 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/762;G06V10/82 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 嵌入 流形 表征 信息 瓶颈 约束 图像 检测 方法 | ||
一种基于嵌入流形表征和信息瓶颈约束的图像检测方法,在离线阶段初始化鉴别器网络和作为编码器或解码器的生成流模型网络并依次计算重构损失函数、信息瓶颈损失函数和雅可比矩阵等距损失函数并得到总损失函数,从而对生成流模型网络以及对鉴别器网络进行反向传播实现训练;在在线阶段通过训练后的生成流模型网络得到待测图像的判别特征和共性特征,并仅对共性特征属于共性特征空间的图像进行图像重构和子流形图像重构,通过计算重构图像到各类别子流形重构图像之间的距离实现图像分类。本发明通过对待分类图像进行预先分析,避免了对无效样本的无意义计算过程,节省计算资源的同时,利用嵌入流形表征算法在图像样本投影以及信息瓶颈约束在特征提取方面的指导作用,其分类鲁棒性表现优秀。
技术领域
本发明涉及的是一种神经网络应用领域的技术,具体是一种基于嵌入流形表征和信息瓶颈约束的图像检测方法。
背景技术
图像分类的主要任务是将输入图像识别为所给定类别中的某一类。作为计算机视觉最为基本的任务,也是图像检测、分割等其他高层视觉任务的基础,图像分类在很多领域有着广泛的应用,如人脸识别、物体检测、视频分析等。这些应用往往要求模型算法具有一定的鲁棒性,其中鲁棒性指的是模型算法对攻击样本的抵抗能力,高鲁棒性即指模型算法面对攻击样本依然能够表现出足够优秀的分类准确率,其中攻击样本是通过诸如对原图添加随机噪声等一些手段得到的、旨在让模型算法给出错误分类结果的样本;然而,现有的基于深度神经网络的分类算法大多都是黑盒模型,其分类的工作机制不透明,这导致了它们不能保证其抵御攻击样本的能力,进而也不能保证其分类结果的鲁棒性。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于嵌入流形表征和信息瓶颈约束的图像检测方法,通过对待分类图像进行预先分析,对不属于任何类别的图像拒绝分类,从而避免了对无效样本的无意义计算过程,节省计算资源的同时,利用嵌入流形表征算法在图像样本投影以及信息瓶颈约束在特征提取方面的指导作用,其分类鲁棒性表现优秀。
本发明是通过以下技术方案实现的:
本发明涉及一种基于嵌入流形表征和信息瓶颈约束的图像检测方法,在离线阶段初始化鉴别器网络和作为编码器或解码器的生成流模型网络并依次计算重构损失函数、信息瓶颈损失函数和雅可比矩阵等距损失函数并得到总损失函数,从而对生成流模型网络以及对鉴别器网络进行反向传播实现训练;在在线阶段通过训练后的生成流模型网络得到待测图像的判别特征和共性特征,并仅对共性特征属于共性特征空间的图像进行图像重构和子流形图像重构,通过计算重构图像到各类别子流形重构图像之间的距离实现图像分类。
所述的作为编码器或解码器是指:当生成流模型网络作为编码器时,通过将输入的图像映射到特征编码空间并判别特征空间和共性特征空间的笛卡尔乘积,得到输入图像对应的共性特征以及判别特征;当生成流模型网络作为解码器时,通过将输入的共性特征和判别特征的联合映射到图像空间,得到对应的重构图像。
所述的生成流模型网络包括:一个维度提升层和一个基本流模块层,其中:维度提升层通过在该特征的末尾填补指定个数的零,将输入共性特征和判别特征联合的维度提升到图像空间对应的维度,作为网络的中间特征;基本流模块层在保证模型网络的雅可比矩阵体积元具有足够复杂度的基础上,对中间特征进行任意复杂的非线性变化以生成对应的重构图像。
所述的维度提升层不包含任何神经网络参数。
所述的基本流模块层包括:依次堆叠的可逆卷积层和仿射耦合层,其中:可逆卷积层在保证可逆的基础上混合输入特征的各个通道特征,仿射耦合层在保证同样可逆的基础上对输入特征做任意复杂的非线性变换,具体为:令输出沿着图像通道维度分割得到的第一部分与输入特征的第一部分保持相同,输出特征的第二部分等于输入特征的第二部分叠加上输入特征第一部分的非线性变换经平移和尺度放缩后的特征结果。
所述的可逆卷积层是指:核大小为1×1、权重矩阵为随机初始化且不可被训练的旋转矩阵的卷积层,不包含可训练参数且其转置卷积操作,即逆映射。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211682208.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种户外安装高度可调的计量箱
- 下一篇:车辆能量回收装置和车辆能量回收方法