[发明专利]模型优化、质量检测方法、装置、设备及存储介质在审
申请号: | 201711242597.0 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108009600A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06N3/04;G06N3/08;G06T7/60 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 优化 质量 检测 方法 装置 设备 存储 介质 | ||
本公开提供一种模型优化、质量检测方法、装置、设备及存储介质,所述模型优化方法包括:获取基于卷积神经网络训练获得的初始模型;基于所述初始模型中卷积层的通道对初始模型预测结果的影响程度,对所述初始模型中卷积层的通道进行筛选,获得目标模型,所述目标模型中卷积层的通道数量少于所述初始模型中卷积层的通道数量;所述卷积层的通道是卷积核的输入通道,每个通道内进行卷积运算。由于减少了卷积层的通道数量,进而减少了卷积运算,因此可以减少计算量,提高计算效率。
技术领域
本申请涉及数据处理技术领域,尤其涉及模型优化、质量检测方法、装置、设备及存储介质。
背景技术
在数据挖掘的业务场景中,经常需要利用大规模的训练数据训练机器学习算法模型,进行分类或者回归计算等。只有用大量数据训练该机器学习算法模型之后,才有可能获得预测精度较高的模型,进而在应用阶段,可以根据输入数据进行各种预测。以图像识别为例,可以基于大规模的训练数据对卷积神经网络进行训练,获得用于进行图像识别的模型。
然而,传统的深度卷积网络结构中,随着卷积层以及卷积核个数的增多,卷积层的通道数也越来越多,而每个通道都会进行卷积运算,因此,过多的通道导致算法的计算量大。
发明内容
为克服相关技术中存在的问题,本公开提供了模型优化、质量检测方法、装置、设备及存储介质。
根据本公开实施例的第一方面,提供一种模型优化方法,所述方法包括:
获取基于卷积神经网络训练获得的初始模型;
基于所述初始模型中卷积层的通道对初始模型预测结果的影响程度,对所述初始模型中卷积层的通道进行筛选,获得目标模型,所述目标模型中卷积层的通道数量少于所述初始模型中卷积层的通道数量;
所述卷积层的通道是卷积核的输入通道,每个通道内进行卷积运算。
在一个可选的实现方式中,所述基于所述初始模型中卷积层的通道对初始模型预测结果的影响程度,对所述初始模型中卷积层的通道进行筛选,获得目标模型,包括:
针对每层卷积层,基于预设的优化目标函数,在保证卷积层的输出值的误差在允许误差范围内时,通过调整通道的权重值,使部分通道的权重值为0,获得卷积层每个通道的权重值;
基于通道的权重值对所述卷积层的通道进行筛选;
在对所有卷积层执行完通道筛选操作后,获得目标模型。
在一个可选的实现方式中,所述优化目标函数如下:
subject to||β||
其中,X
在一个可选的实现方式中,所述基于通道的权重值对所述卷积层的通道进行筛选,包括:
若β
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711242597.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于低温大温差环境下的混凝土
- 下一篇:一种有机发光显示面板及显示装置