[发明专利]扩展repvgg结构模型的方法、图像处理方法、装置在审
申请号: | 202111507430.9 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114511761A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 阚欣 | 申请(专利权)人: | 成都臻识科技发展有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 孙元伟 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扩展 repvgg 结构 模型 方法 图像 处理 装置 | ||
本发明公开了一种扩展repvgg结构模型的方法、图像处理方法、装置,包括步骤:S1:根据问题采集对应图片;S2:对采集的图片进行标注;S3:设计深度卷积神经网络,在repvgg的基础上在每个conv旁边增加额外的k个卷积,conv1,conv2,…,convk;S4:将图片及对应标注信息输入设计好的深度卷积神经网络进行训练,得到训练完毕的模型;S5:把训练完的模型进行融合权值处理得到最终模型;S7:利用最终模型解决图像处理问题。本发明能够在更大的参数空间下可能学到更好的权值,从而得到效果更好的模型,应用到图像处理技术中,能够带来更大的参数空间,降低计算量,提高图像处理效率。
技术领域
本发明涉及图像处理领域,更为具体的,涉及扩展repvgg结构模型的方法、图像处理方法、装置。
背景技术
在深度卷积神经网络中,resnet结构的出现大为提高了同等参数量/计算量下模型的效果,并因为其中的跨层连接,方便梯度无损回传而使得模型训练大为加速而且开始能够训练很深的模型。但在模型的实际部署中,大部分需要部署的设备由于硬件特性与优化设置,导致resnet会比同等计算量的vgg结构模型速度更慢,因此resnet很多时候并不适合用于实际应用部署。
随着技术的发展,后来提出的repvgg结构针对resnet结构的缺点,以vgg结构为骨架,发明了一种新的结构:训练的时候给vgg结构加入类似resnet结构中的跨层连接,但去掉里面的relu激活函数,训练完毕后通过权值融合的手段去掉跨层连接,最终得到一个vgg结构的模型,效果好且部署执行效率高。
repvgg主要通过给vgg增加可以后期融合的跨层连接,来在训练时得到resnet的优点:跨层连接方便梯度回传因此易于模型训练,导致最终可能效果可以更好,但是存在如下缺点:其并不带来更大的参数空间,参数空间小。因此,基于repvgg结构模型的图像处理技术存在参数搜索空间小,图像处理效率低下的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种扩展repvgg结构模型的方法、图像处理方法、装置,能够在更大的参数空间下可能学到更好的权值,从而得到效果更好的模型,应用到图像处理技术中,能够带来更大的参数空间,降低计算量,提高图像处理效率等。
本发明的目的是通过以下方案实现的:
一种扩展repvgg结构模型的方法,包括步骤S3:
S3:基于可读存储介质,在repvgg结构的基础上,在每个conv旁边增加额外的k个卷积,k个卷积包括conv1,conv2,…,convk,得到扩展结构。
进一步地,每个卷积convk满足以下条件:conv后面带有bn层,convk后面带有bn层。
进一步地,每个卷积convk满足以下条件:convk的每个维度的kernel size都要小于等于conv的该维度的kernelsize。
进一步地,每个卷积convk满足以下条件:convk的group数要小于等于conv的group数。
进一步地,每个卷积convk满足以下条件:convk的outputchannel要等于conv的outputchannel。
进一步地,每个卷积convk满足以下条件:每个卷积convk满足以下条件:convk的output特征图的大小要等于conv的output特征图的大小。
进一步地,每个卷积convk满足以下条件:convk的每个维度的stride要等于conv的该维度的stride。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都臻识科技发展有限公司,未经成都臻识科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111507430.9/2.html,转载请声明来源钻瓜专利网。