[发明专利]模型生成的方法、装置、计算机设备和存储介质在审
申请号: | 202010196133.6 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111428869A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 王鹏军;黄智科 | 申请(专利权)人: | 北京源清慧虹信息科技有限公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06N3/08 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 孙岩 |
地址: | 100192 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种模型生成的方法、装置、计算机设备和存储介质。该方法包括:计算机设备获取待创建的神经网络模型的样本参数;根据样本参数,获取神经网络模型的训练数据样本;计算机设备接收用户输入的神经网络创建指令,创建神经网络模型,该神经网络创建指令中包括神经网络模型包含的各网络层的类型、每个网络层的激活状态及包含的神经元的数目和输入数据维度;计算机设备根据训练数据样本、训练方法和用户输入的训练样本策略,对神经网络模型进行训练,得到目标神经网络模型。采用本方法可以通过人机交互的方式,实现神经网络模型的生成。
技术领域
本申请涉及计算机技术领域,特别是涉及一种模型生成的方法、装置、计算机设备和存储介质。
背景技术
随着大数据时代的到来,出现了越来越多数据处理的方法和模型,其中,利用神经网络模型进行数据处理,可以广泛的应用于神经科学、人工智能、信息处理等多个领域。
然而,神经网络模型的生成,需要使用者具备专业的编程能力且具有专业的编程设备,因此,亟需一种通过简单设置,就可以实现模型生成的方法。
发明内容
基于此,有必要针对上述技术问题,提供一种模型生成的方法、装置、计算机设备和存储介质。
第一方面,提供了一种模型生成的方法,所述方法包括:
获取待创建的神经网络模型的样本参数;
根据所述样本参数,获取所述神经网络模型的训练数据样本;
接收用户输入的神经网络创建指令,创建所述神经网络模型,所述神经网络创建指令中包括所述神经网络模型包含的各网络层的类型、每个网络层的激活状态及包含的神经元的数目和输入数据维度;
根据所述训练数据样本、训练方法和用户输入的训练样本策略,对所述神经网络模型进行训练,得到目标神经网络模型。
作为一种可选的实施方式,所述方法还包括:
获取所述目标神经网络模型的模型收敛曲线,并根据所述模型收敛曲线中的损失值和度量值,对所述目标神经网络模型的收敛性进行判断;
如果所述损失值小于所述预设损失阈值且所述度量值小于所述预设度量阈值,则判定所述目标神经网络模型收敛;
如果所述损失值大于或等于所述预设损失阈值或所述度量值大于或等于所述预设度量阈值,则判定所述目标神经网络模型不收敛,并提示用户重新修改所述训练样本策略和所述训练方法中的编译参数。
作为一种可选的实施方式,所述方法还包括:
根据所述训练样本策略中的验证拆分参数,获得验证数据集,并根据所述验证数据集对所述目标神经网络模型进行验证评分处理,得到验证评分;
如果所述验证评分低于预设的分数阈值,则重新执行所述根据所述训练数据样本、训练方法和用户输入的训练样本策略,对所述神经网络模型进行训练,得到目标神经网络模型的步骤;
如果所述验证评分等于或高于所述预设的分数阈值,则导出所述目标神经网络模型。
作为一种可选的实施方式,所述根据所述样本参数,获取所述神经网络模型的训练数据样本,包括:
根据所述样本参数,获取导入数据样本;
根据预设的数据处理方法,对所述导入数据样本进行抽取-转换-加载处理,得到所述训练数据样本。
第二方面,提供了一种模型的生成装置,所述装置包括:
第一获取模块,用于获取待创建的神经网络模型的样本参数;
第二获取模块,用于根据所述样本参数,获取所述神经网络模型的训练数据样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京源清慧虹信息科技有限公司,未经北京源清慧虹信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010196133.6/2.html,转载请声明来源钻瓜专利网。