[发明专利]深度学习模型的建立方法、图像处理方法及装置有效
申请号: | 201910356937.5 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110222816B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 郭梓超 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62;G06V10/774;G06V10/82 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 模型 建立 方法 图像 处理 装置 | ||
本发明提供了一种深度学习模型的建立方法、图像处理方法及装置,在第一深度学习模型中,将卷积层的最大输入通道数及最大输出通道数,设置为卷积层的权重池的体积参数;将多个比例参数依次与权重池的体积参数相乘,得到多个子权重池;针对子权重池依次进行卷积计算,并根据计算得到的每个子权重池的输出通道数,建立多个第二深度学习模型,将第二深度学习模型导入启发式算法模型,输出满足预设测试指标的第三深度学习模型。本发明通过划分多个具有不同宽度组合的第二深度学习模型,并利用启发式算法模型,从第二深度学习模型中筛选出具有优选宽度组合的第三深度学习模型,达到了模型宽度设定的自动化的目的,减少了模型训练所需的资源。
技术领域
本发明属于计算机技术领域,特别是涉及一种深度学习模型的建立方法、图像处理方法及装置。
背景技术
深度学习模型源于对人工神经网络的研究,关于深度学习模型的模型宽度(即各卷积层的通道数)参数的设置过程,关系到深度学习模型的性能,以及深度学习模型与业务或作业之间的匹配度。
在目前,深度学习模型的模型宽度设计千变万化,宽度是指模型卷积层的输出通道数,不同卷积层往往需要设计不同的输出通道数,即以不同特征图的数量来进行特征表示,现有常用的设计思路是通过对模型的测试,不断的人工调整模型宽度参数,越往后面的卷积层,往往需要设计更多的通道数,比如会在步幅为2的下采样卷积层,直接对通道数进行翻倍。
但是,目前主流的模型宽度设置方法,并不能保证经过人工测试后直接设置的模型宽度,能够符合业务或作业所需求的速度限制或内存限制,因此需要进一步根据模型的运行情况,对模型宽度进行多次调节,导致一个与业务或作业匹配的深度学习模型的建立,需要花费过多时间进行模型宽度调整,降低了模型的建立效率。
发明内容
本发明提供一种深度学习模型的建立方法、图像处理方法及装置,以便解决现有技术中需要花费过多时间进行模型宽度调整,降低了模型的建立效率的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种深度学习模型的建立方法,该方法可以包括:
在第一深度学习模型中,将每一层卷积层的最大输入通道数及最大输出通道数,设置为所述卷积层对应的权重池的体积参数;
将多个比例参数依次与所述权重池的体积参数相乘,得到多个子权重池;
针对所述卷积层包括的子权重池依次进行卷积计算,并根据计算得到的每个所述子权重池的输出通道数,建立多个第二深度学习模型,所述第二深度学习模型的每一层卷积层设置有相应的目标输出通道数;
将所述第二深度学习模型导入启发式算法模型,输出满足预设测试指标的第三深度学习模型。
第二方面,本发明实施例提供了一种图像处理方法,该方法可以包括:
获取待处理图像;
将所述待处理图像输入第三深度学习模型进行处理,输出针对所述待处理图像的处理结果。
第三方面,本发明实施例提供了一种深度学习模型的建立装置,该深度学习模型的建立装置可以包括:
初始化模块,用于在第一深度学习模型中,将每一层卷积层的最大输入通道数及最大输出通道数,设置为所述卷积层对应的权重池的体积参数;
划分模块,用于将多个比例参数依次与所述权重池的体积参数相乘,得到多个子权重池;
卷积计算模块,用于针对所述卷积层包括的子权重池依次进行卷积计算,并根据计算得到的每个所述子权重池的输出通道数,建立多个第二深度学习模型,所述第二深度学习模型的每一层卷积层设置有相应的目标输出通道数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910356937.5/2.html,转载请声明来源钻瓜专利网。