[发明专利]基于张量分析的全分辨率深度卷积神经网络图像分类方法有效
申请号: | 201910453320.5 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110222754B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 庞彦伟;谢今;李亚钊;张志杰;汪天才 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于张量分析的全分辨率深度卷积神经网络图像分类方法,包括如下步骤:准备训练图像集合及集合中每幅图像的类别标签;设定全分辨率卷积神经网络的层数和计算全分辨率卷积所需要的滤波器参数,用全分辨率卷积得到主干网络;根据图像的大小确定张量分析次数,对张量Y进行张量分析,以逐渐缩小Y并得到核张量Z;将得到的核张量Z进行若干次全连接,对类别向量的每个元素进行Sigmoid运算,实现图像分类;设定整个深度卷积网络训练的损失函数,该损失函数主要衡量神经网络预测分类标签和图像真实标签之间的差别;通过反向传播算法,不断更新网络的权重参数。 | ||
搜索关键词: | 基于 张量分析 分辨率 深度 卷积 神经网络 图像 分类 方法 | ||
【主权项】:
1.一种基于张量分析的全分辨率深度卷积神经网络图像分类方法,包括如下步骤:步骤1:准备训练图像集合及集合中每幅图像的类别标签。设类别标签的个数为k、图像宽度为W、图像高度为H。步骤2:设定全分辨率卷积神经网络的层数和计算全分辨率卷积所需要的滤波器参数,用全分辨率卷积得到主干网络,主干网络每个特征层的宽度和高度都与输入图像的宽度和高度一样大,记主干网络最后一层的特征图为张量Y,其通道数为C,Y的大小是WHC;步骤3:根据图像的大小确定张量分析次数,对张量Y进行张量分析,以逐渐缩小Y并得到核张量Z,在第i次张量分析中将第i‑1次张量分析的结果Zi作输入,进行一次张量分析的过程如下:一次张量分析分为上下两个支路,对于上支路,首先对Y进行全宽度卷积,将Y的宽度缩减为P,得到张量记为T1,其大小为PHC;然后对张量T1进行全高度卷积,将Y的高度缩减为Q,得到张量T2,其大小为PQC;接着对张量T2进行全通道卷积,将T2的通道数由C高度缩减为D,得到张量T3,其大小为PQD;下支路与上支路操作类似,但顺序不同,下支路依次进行全高度卷积、全宽度卷积和全通道卷积,对应地依次缩减高度、宽度和通道;下支路依次得到张量B1、B2和B3,其大小依次为WQC、PQC、和PQD;最后将上下两个支路的输出求和得到最终的核张量Z,其大小为PQD;步骤4:将步骤三张量分析得到的核张量Z进行若干次全连接得到k维类别向量b,对类别向量的每个元素进行Sigmoid运算,实现图像分类;步骤5:设定整个深度卷积网络训练的损失函数,该损失函数主要衡量神经网络预测分类标签和图像真实标签之间的差别;步骤6:通过反向传播算法,不断更新网络的权重参数,即全卷积滤波器的参数、张量分析的参数和全连接的参数,当迭代次数结束时,所学习的权重参数为最终的网络参数;步骤7:给定待分类的图像,将其输入给全分辨率神经网络,输出的类别向量即是最终分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910453320.5/,转载请声明来源钻瓜专利网。