[发明专利]神经网络的确定方法、装置、设备及计算机可读存储介质在审
申请号: | 202110016585.6 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112699997A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 初祥祥;陆顺;魏晓林 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 唐述灿 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 确定 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请公开了神经网络的确定方法、装置、设备和计算机可读存储介质,属于人工智能技术领域。方法包括:获取目标对象集和神经元数据,神经元数据包括多个神经元以及各个神经元的初始权重参数和初始架构参数;基于多个神经元以及各个神经元的初始权重参数和初始架构参数,建立第一神经网络;在第一神经网络中添加跳跃连接,得到第二神经网络,跳跃连接的权重参数满足目标衰减策略,跳跃连接用于降低跳跃神经元的初始架构参数的变化速率;基于目标对象集,对第二神经网络进行处理,得到目标神经元,目标神经元为架构参数满足目标要求的神经元;基于目标神经元建立目标神经网络,目标神经网络用于建立目标模型。该方法提高目标神经网络的确定速度。
技术领域
本申请实施例涉及人工智能技术领域,特别涉及一种神经网络的确定方法、装置、设备及计算机可读存储介质。
背景技术
神经网络搜索(Neural Architecture Search,NAS)是自动化机器学习(Automated Machine Learning,AutoML)中的一个重要分支,神经网络搜索用于在多个神经网络中确定一个目标神经网络,该目标神经网络用于建立目标模型。
相关技术中,神经网络搜索包括搜索策略、搜索空间和评估机制三个阶段。其中,搜索空间中存储有多个神经网络,评估机制用于对神经网络的性能进行评估。例如,根据用户设计的搜索策略在搜索空间中确定神经网络A,基于评估机制对神经网络A进行评估,得到神经网络A的性能,重复该操作,直至搜索到性能优异的目标神经网络。基于该目标神经网络,建立目标模型。
然而,上述确定的神经网络需要遍历搜索空间中的所有神经网络,并对每一个神经网络进行性能评估,因而成本开销较大,容易导致时间成本的浪费,使得建立目标模型的时间较长,效率较低。
发明内容
本申请实施例提供了一种神经网络的确定方法、装置、设备及计算机可读存储介质,可用于解决相关技术中的问题。所述技术方案如下:
一方面,本申请实施例提供了一种神经网络的确定方法,所述方法包括:
获取目标对象集和神经元数据,所述神经元数据包括多个神经元以及各个神经元的初始权重参数和初始架构参数,所述多个神经元包括跳跃神经元;
基于所述多个神经元以及各个神经元的初始权重参数和初始架构参数,建立第一神经网络;
在所述第一神经网络中添加跳跃连接,得到第二神经网络,所述跳跃连接的权重参数满足目标衰减策略,所述跳跃连接用于降低所述跳跃神经元的初始架构参数的变化速率;
基于所述目标对象集,对所述第二神经网络进行处理,得到目标神经元,所述目标神经元为架构参数满足目标要求的神经元;
基于所述目标神经元建立目标神经网络,所述目标神经网络用于建立目标模型。
在一种可能的实现方式中,所述基于所述目标对象集,对所述第二神经网络进行处理,得到目标神经元,包括:
基于所述目标对象集,对所述第二神经网络进行迭代训练,得到迭代训练终止时所述各个神经元的目标权重参数和目标架构参数,所述迭代训练的终止条件为所述跳跃连接的权重参数衰减为目标数值;
基于所述各个神经元的目标架构参数,在所述多个神经元中确定目标架构参数满足目标要求的目标神经元。
在一种可能的实现方式中,所述在所述第一神经网络中添加跳跃连接,得到第二神经网络,包括:
确定所述第一神经网络的类型;
响应于所述第一神经网络的类型为第一类型,在所述第一神经网络中添加具有权重参数的跳跃连接,得到第二神经网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110016585.6/2.html,转载请声明来源钻瓜专利网。