[发明专利]流形学习网络及基于其的计算机视觉图像集分类方法有效
申请号: | 201811289756.7 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109376787B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 郑军;王锐;罗长志 | 申请(专利权)人: | 聚时科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200082 上海市杨浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流形 学习 网络 基于 计算机 视觉 图像 分类 方法 | ||
1.一种基于流形学习网络的计算机视觉图像集分类方法,其特征在于,所述流形学习网络包括:
输入层,用于获取与待分类的图像集对应的对称正定流形;
特征抽取层,用于对输入层接收的数据进行特征抽取;
矫正层,用于对抽取的特征值进行调整,保持样本空间一致性;
黎曼池化层,用于对特征进行池化操作,降低网络复杂度,所述黎曼池化层包括依次连接的第一对数映射层、池化层和指数映射层;
第二对数映射层,用于将黎曼池化层输出的流形数据映射到欧式空间,获得欧式空间特征图谱;
输出层,用于将欧式空间特征图谱中的每一个特征图均转化成列向量,并按设定权重合并成输出列向量;
所述计算机视觉图像集分类方法包括以下步骤:
1)获取待分类图像集,计算与该待分类图像集对应的对称正定流形;
2)将所述对称正定流形输入训练好的所述流形学习网络中,获取输出列向量;
3)基于所述输出列向量,通过最近邻分类器获得各图像集所属类别;
所述流形学习网络进行训练时输入的对称正定流形通过以下方式获得:
A)对采集到的视频序列进行图像帧提取,获得彩色图像;
B)将彩色图像灰度化并进行直方图均衡化操作,形成训练图像集,且每张图片以一个列向量表示;
C)计算训练图像集对应的协方差矩阵Xi:
其中,μi代表图像集Si的均值,ni表示第i个训练图像集中所含有的图片个数;
D)添加扰动信息:
Xi=Xi+trace(Xi)×Id×λ
其中,trace()表示轨迹函数,Id是一个d×d的单位矩阵,λ为扰动参数;
E)由步骤D)获得的一系列Xi所张成的空间即为对称正定流形;
所述特征抽取层的输出与输入的关系式表示为:
其中,表示特征抽取层输出的第j个特征图,为连接权重,Xi表示特征抽取层的输入。
2.根据权利要求1所述的计算机视觉图像集分类方法,其特征在于,所述矫正层对特征值进行调整后,矫正层的输出与输入的关系式表示为:
其中,表示矫正层的输出,表示输入的奇异值分解,ε表示设定阈值。
3.根据权利要求1所述的计算机视觉图像集分类方法,其特征在于,输出层中,所述设定权重的计算公式为:
其中,表示对第二对数映射层输出的第i个特征图进行特征分解后所得到的第k个特征向量,l表示特征图总数。
4.根据权利要求1所述的计算机视觉图像集分类方法,其特征在于,所述流形学习网络中的特征抽取层利用双向二维主成分分析进行无监督的权值优化学习。
5.根据权利要求1所述的计算机视觉图像集分类方法,其特征在于,所述流形学习网络训练时,将网络获得的输出列向量传入到核辨别分析中进行特征学习得到投影矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于聚时科技(上海)有限公司,未经聚时科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811289756.7/1.html,转载请声明来源钻瓜专利网。