[发明专利]生成深度神经网络的方法、装置和计算机可读存储介质在审
申请号: | 201710893595.1 | 申请日: | 2017-09-27 |
公开(公告)号: | CN108205707A | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 孔畅;李嘉斌;刘文志 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 姚泽鑫 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络模型 训练样本 样本特征 计算机可读存储介质 神经网络 终止条件 自适应性 人工智能领域 模型分子 模型结构 | ||
1.一种生成深度神经网络的方法,其特征在于,所述方法包括:
将训练样本输入深度神经网络模型,获得所述训练样本的样本特征,所述深度神经网络模型用于完成目标任务;
根据所述样本特征确定所述深度神经网络模型的训练不满足训练终止条件,则以模型分子为单位扩展所述深度神经网络模型的模型结构,并再次执行将训练样本输入深度神经网络模型的步骤,直至得到的所述样本特征满足训练终止条件时停止训练;
所述模型分子为根据所述目标任务的需求对模型原子进行组合得到子网络结构,所述模型原子包括卷积单元,池化单元,非线性单元以及全连接单元任一项以上的组合。
2.如权利要求1所述的方法,其特征在于,所述将训练样本输入深度神经网络模型,获得所述训练样本的样本特征之前,包括:
使用短路映射的方式设置所述深度神经网络模型的网络结构。
3.如权利要求2所述的方法,其特征在于,以正则化处理的方式设置所述深度神经网络模型的输出模块。
4.如权利要求1所述的方法,其特征在于,所述根据所述样本特征确定所述深度神经网络模型的训练不满足训练终止条件,则以模型分子为单位扩展所述深度神经网络模型的模型结构之前,包括:
根据所述样本特征确定所述深度神经网络模型是否收敛;
若不收敛,则确定所述训练的结果不满足训练终止条件;
若收敛,则确定所述训练的结果是否满足所述目标任务的预设效果,若否,则确定所述训练的结果不满足训练终止条件。
5.如权利要求4所述的方法,其特征在于,所述确定所述训练的结果是否满足所述目标任务的预设效果,包括:
根据所述样本特征获得所述深度神经网络模型在训练样本上的损失函数,若所述损失函数的值下降至预设损失阈值,则确定所述目标任务满足预设效果;
或者,
若所述深度神经网络模型在测试样本上的识别准确率达到预设识别阈值率,则确定所述目标任务满足预设效果。
6.如权利要求1所述的方法,其特征在于,所述以模型分子为单位扩展所述深度神经网络模型的模型结构,并再次执行将训练样本输入深度神经网络模型的步骤,直至得到的所述样本特征满足训练终止条件时停止训练之后,包括:
根据剪枝权重对所述停止训练后的深度神经网络模型进行剪枝处理。
7.如权利要求6所述的方法,其特征在于,所述根据剪枝权重对所述停止训练后的深度神经网络模型进行剪枝处理,包括:
以模型分子为单位对所述停止训练后的深度神经网络模型进行剪枝,保留所述剪枝后的深度神经网络模型;
对所述保留的深度神经网络模型采用双贪心剪枝策略再次进行剪枝处理。
8.一种生成深度神经网络的装置,其特征在于,所述装置包括:
样本特征获取模块,用于将训练样本输入深度神经网络模型,获得所述训练样本的样本特征,所述深度神经网络模型用于完成目标任务;
扩展模块,用于根据所述样本特征确定所述深度神经网络模型的训练不满足训练终止条件,则以模型分子为单位扩展所述深度神经网络模型的模型结构,并再次执行将训练样本输入深度神经网络模型的步骤,直至得到的所述样本特征满足训练终止条件;
所述模型分子为根据所述目标任务的需求对模型原子进行组合得到子网络结构,所述模型原子包括卷积单元,池化单元,非线性单元以及全连接单元任一项以上的组合。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710893595.1/1.html,转载请声明来源钻瓜专利网。