[发明专利]一种深度神经网络的结构搜索方法及装置在审
申请号: | 201911007284.6 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110717586A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 黄泽昊;张新邦;王乃岩 | 申请(专利权)人: | 北京图森未来科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 101300 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种深度神经网络的结构搜索方法及装置,涉及人工智能技术领域。方法包括:在预先设置的搜索空间中获得深度神经网络中依次串接的每个模块中的每层计算单元结构;在每个模块中采用预设连接方式将各计算单元进行连接,得到每个模块中的信息流;根据模块及每个模块中的计算单元的连接情况,得到初始神经网络;对初始神经网络中的信息流设置稀疏缩放算子,其中稀疏缩放算子用于对信息流进行缩放;采用预置的训练样本数据对初始神经网络的权重和信息流的稀疏缩放算子进行训练,得到中间神经网络;将中间神经网络中稀疏缩放算子为零的信息流删除,得到搜索空间内的搜索结果神经网络。本申请可以节省网络结构搜索的时间。 | ||
搜索关键词: | 神经网络 缩放 算子 稀疏 信息流 计算单元 搜索空间 人工智能技术 训练样本数据 信息流删除 结构搜索 连接方式 搜索结果 网络结构 依次串接 预先设置 权重和 预设 预置 申请 搜索 | ||
【主权项】:
1.一种深度神经网络的结构搜索方法,其特征在于,包括:/n在预先设置的搜索空间中获得深度神经网络中依次串接的每个模块中的每层计算单元结构;所述每层计算单元结构包括至少一个计算单元;/n在每个模块中采用预设连接方式将各计算单元进行连接,得到每个模块中的信息流;其中,处于同一层计算单元结构的计算单元之间不进行连接,每个计算单元能够与和其所在模块中的不同层的计算单元,以及其所在模块的输入和输出进行连接;/n根据模块及每个模块中的计算单元的连接情况,得到初始神经网络;/n对所述初始神经网络中的信息流设置稀疏缩放算子,其中所述稀疏缩放算子用于对所述信息流进行缩放;/n采用预置的训练样本数据对所述初始神经网络的权重和信息流的稀疏缩放算子进行训练,得到中间神经网络;/n将所述中间神经网络中稀疏缩放算子为零的信息流删除,得到搜索空间内的搜索结果神经网络。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京图森未来科技有限公司,未经北京图森未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911007284.6/,转载请声明来源钻瓜专利网。