[发明专利]一种基于偏微分算子的等变卷积网络模型的图像分类方法有效
申请号: | 202010189225.1 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111401452B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 林宙辰;沈铮阳;何翎申 | 申请(专利权)人: | 北京大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 微分 算子 卷积 网络 模型 图像 分类 方法 | ||
本发明公布了一种基于偏微分算子的等变卷积网络模型的图像分类方法,针对卷积网络模型的输入层和中间层,基于偏微分算子分别设计输入层的等变卷积和中间层的等变卷积,构建等变卷积网络模型PDO‑eConv,并进行模型训练;模型PDO‑eConv输入为图像数据,输出为图像的预测分类,从而实现高效地进行图像分类识别视觉分析。本发明能够提供更好的参数共享机制,达到更低的图像分类错误率。
技术领域
本发明属于模式识别、机器学习、人工智能技术领域,涉及图像分类方法,具体涉及 一种基于偏微分算子的等变卷积网络模型的图像分类方法。
背景技术
在过去的几年中,卷积神经网络(CNN)模型已成为用于图像识别任务的主要机器学习 方法。与全连接网络相比,采用CNN处理图像的一个显着优势是它们是平移等变的:先将 图像平移然后通过若干个卷积层得到的特征图与先将原始图像通过卷积层然后再平移得到 的结果相同。换句话说,每一层都保持了平移对称性,即等变性。同样,等变性带来了权 重共享,通过它可以更有效地使用参数。
为了在用神经网络提取特征时,能够保持更多的对称性,已有工作包括Cohen和Welling(Group equivariant convolutional networks)提出的群等变卷积网络(G-CNN),该工作展示了如何推广卷积网络,以利用更多对称性,包括旋转和反射。G-CNN在群p4m 或p4上具有等变性。一般地,用pnm表示由平移,反射和旋转2π/n这些元素生成的群,其 中p代表旋转,n代表旋转变换的个数,m代表反射变换;用pn表示仅由平移和旋转2π/n 生成的群。当n给定时,即得到一个具体的群,如群p4m和群p4。进一步地,Hoogeboom 等人提出了HexaConv,并展示了如何在六角形格子,而不是正方形格子,上实现群等变卷积 操作。相应地,等变性扩展到群p6m(即旋转变换的个数为6的由平移、反射和旋转π/3生 成的群)上。但是,由于很难找到除了正方形和六边形网格的其他离散晶格形式,很难用 相似的方式设计出对除了π/4和π/3的更小旋转角度等变的CNN。
由于在2D平面上的晶格上似乎没有更多的旋转对称性,因此一些工作致力于设计对于 更大的群近似等变的网络结构。Zhou等人提出了定向响应网络0RN(0rientedresponse networks),它在卷积过程中旋转滤波器并生成具有位置和方向编码的特征图。然而,它 从本质上就是近似等变的网络。Weiler等人提出了基于可操纵滤波器(卷积)的SFCNN (Learning steerable filters for rotation equivariant CNNs)。如果将输入数据看作 是连续的,它达到的等变性是确切的。然而在实现中,SFCNN需要用很大的卷积核来逼近 可操纵滤波器,这会带来较大的计算负担,并且等变性也变为近似的。即使如此,一些边 缘信息也会被舍弃,使得等变性不够精确。
事实上,也有一些工作利用偏微分算子来设计等变的特征提取器,用在图像识别任务 上。Liu等人将一系列等变的偏微分算子线性加权,设计出了一种可学习的偏微分方程 (Toward designing intelligent PDEs for computer vision:An optimal controlapproach),它本身就是平移和旋转等变的。Fang等人将该技术应用到人脸识别任务上(Feature learning via partial differential equation with applications to facerecognition)。但是,总体说来,可学习偏微分方程的模型表达能力远远比不上CNN网络,因此,图像识别效果也不够理想。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于偏微分算子的等变卷积网络模型 的图像分类方法,利用偏微分算子设计得到等变的卷积网络模型,取名为PD0-eConv(partial diffrential operator based equivariant convolution),用于高效的进行图像分类与识别等视觉分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010189225.1/2.html,转载请声明来源钻瓜专利网。