[发明专利]一种自适应形变空洞卷积方法在审
申请号: | 201910049890.8 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109858612A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 王吴凡;朱纪洪;匡敏驰;闫星辉 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 张杰 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 空洞 形变 自适应 反向传播 推导模型 前向 离散空间 连续空间 连续模型 未知参数 训练数据 学习 转换 | ||
本发明公开了一种自适应形变空洞卷积方法,包括:自适应形变空洞卷积前向推导模型和自适应形变空洞卷积梯度反向传播模型。特征是所述自适应形变空洞卷积方法将空洞卷积的扩张率作为模型未知参数,通过训练数据自主学习扩张率。所述自适应形变空洞卷积前向推导模型将传统空洞卷积中的离散超参数扩张率转换为连续模型参数,从而将空洞卷积的输入由离散空间扩展到连续空间,并且使得自适应形变空洞卷积的扩张率能够通过所述自适应形变空洞卷积梯度反向传播模型来学习。本发明的自适应形变空洞卷积方法能够自主学习扩张率,灵活性高,适用于推广应用。
技术领域
本发明属于深度学习领域,特别涉及一种可形变空洞卷积方法。
背景技术
空洞卷积(atrous convolution)又名扩张卷积(dilated convolution),通过在标准卷积核中注入空洞,能够在不增加模型参数和计算量的条件下增加神经元的感受野。空洞卷积通常被串联或并联使用以提取全局或多尺度信息,进而提升神经网络的性能。作为空洞卷积的核心超参数,扩张率(dilation rate)定义了向卷积核注入空洞的间距。扩张率太小会限制神经元的感受野,使其无法有效提取全局特征;扩张率太大又会导致学习到远距离的不相关特征并丢失近距离的细节信息。因此,选择合适的扩张率往往是一件非常困难的任务。
发明内容
为了克服上述空洞卷积超参数扩张率选取困难的问题,本发明提供一种自适应形变空洞卷积方法。
一种自适应形变空洞卷积方法属于深度学习领域,其特征在于,包括自适应形变空洞卷积前向推导模型和自适应形变空洞卷积梯度反向传播模型,自适应形变空洞卷积方法将空洞卷积的扩张率作为模型未知参数,利用训练数据自主学习扩张率(如图1所示)。
本发明的自适应形变空洞卷积的扩张率在自适应形变空洞卷积前向推导模型中固定不变。
本发明的自适应形变空洞卷积前向推导模型通过插值将空洞卷积的输入从离散空间扩展到连续空间。
本发明的自适应形变空洞卷积的扩张率通过自适应形变空洞卷积梯度反向传播模型进行自适应调整。
附图说明
图1是本发明一种自适应形变空洞卷积示意图。
图2是本发明一种自适应形变空洞卷积索引位置为非整数的像素值计算示意图。
具体实施方式
下面采用附图和实施例对本发明做进一步说明,此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。
一种自适应形变空洞卷积方法示意图见附图1,其特征在于:
所述自适应形变空洞卷积方法将空洞卷积的扩张率作为模型未知参数,利用训练数据自主学习扩张率。
所述自适应形变空洞卷积前向推导模型将传统空洞卷积中的离散超参数扩张率转换为连续模型参数,从而将空洞卷积的输入由离散空间扩展到连续空间,并且使得所述扩张率能够通过所述自适应形变空洞卷积梯度反向传播模型来学习。具体地,对于二维自适应空洞卷积,假设输出有一个通道(可扩展至多通道),其前向推导模型可表示为:
其中p0=(m,n)是卷积核中心点所对应像素点的位置索引,c是输入的通道索引,r是连续的扩张率,wc,(i,j)是指定通道与位置的卷积核权重,是指定通道与位置的像素值,G是采样网格。特别地,当卷积核大小为3×3时,采样网格
G={(-1,-1),(-1,0),(0,-1),(-1,1),(1,-1),(0,0),(0,1),(1,0),(1,1)}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910049890.8/2.html,转载请声明来源钻瓜专利网。