[发明专利]DBN的优化方法及装置、存储介质及电子设备在审
申请号: | 202211048113.X | 申请日: | 2022-08-30 |
公开(公告)号: | CN115392455A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 刘淑贤 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张欣然 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | dbn 优化 方法 装置 存储 介质 电子设备 | ||
本申请公开了DBN的优化方法及装置、存储介质及电子设备,可应用于神经网络领域或金融领域,方法包括:获取训练集、测试集和验证集;确定DBN中的RBM层数;执行DBN对应的训练过程,包括:应用训练集及PSO算法对每个RBM进行寻优处理;基于测试集、各个已处理的RBM以及BP算法对DBN进行反向微调;计算反向微调后DBN的模型误差下降率;当模型误差下降率大于误差阈值时,重新执行训练过程,反之,得到DBN的隐藏层的神经网络状态信息;应用验证集及所述神经网络状态信息对DBN进行性能评估;当评估结果符合评估要求,完成对述DBN的优化过程。应用本发明提供的方法,可以优化DBN,提高DBN的精度。
技术领域
本发明涉及神经网络模型训练技术领域,特别是涉及一种DBN的优化方法及装置、存储介质及电子设备。
背景技术
DBN(Deep BeliefNetwork,深度置信网络)是一种概率生成模型,DBN网络是通过逐层贪婪堆叠多个受限玻尔兹曼机(restricted Boltzmann machine,RBM)形成的,具体由3层RBM堆叠而成,其中顶端RBM的输入是上端RBM的隐藏层,第三层RBM通过数据重构后达到输出层,DBN用于分类预测输出时,输出层常连接Softmax层。但是DBN隐藏层数和节点数无法通过简单的控制变量进行观测,因此在对DBN进行训练时,容易影响DBN的训练精度。
发明内容
有鉴于此,本发明提供一种DBN的优化方法,通过该方法,可以优化DBN,提高DBN的精度。
本发明还提供了一种DBN的优化装置,用以保证上述方法在实际中的实现及应用。
一种DBN的优化方法,包括:
获取预先设置的训练集、测试集和验证集;
确定所述DBN中的RBM层数;
执行所述DBN对应的训练过程;
其中,所述训练过程包括:应用所述训练集中的各个训练数据以及预设的PSO算法,对每个所述RBM层数中的RBM进行寻优处理,获得所述DBN中各个已处理的RBM;基于所述测试集中的各个测试数据、各个所述已处理的RBM以及预设的BP算法,对所述DBN进行反向微调;
计算对所述DBN进行反向微调后所述DBN的模型误差下降率;
当所述DBN的模型误差下降率大于预设的误差阈值时,重新执行所述DBN对应的训练过程,直至当前获得的模型误差下降率不大于所述误差阈值时,得到所述DBN的隐藏层的神经网络状态信息;
应用所述验证集中的各个验证数据及所述神经网络状态信息对所述DBN进行性能评估;
当所述性能评估的评估结果符合预设的评估要求,完成对所述DBN的优化过程。
上述的方法,可选的,执行所述DBN对应的训练过程之前,还包括:
获取所述训练集中的各个训练数据、所述测试集中的各个测试数据以及所述验证集中的各个验证数据;
对各个所述训练数据、测试数据以及验证数据进行数据预处理,获得已处理的训练集、已处理的测试集以及已处理的验证集。
上述的方法,可选的,所述应用所述训练集中的各个训练数据以及预设的PSO算法,对每个所述RBM层数中的RBM进行寻优处理,获得所述DBN中各个已处理的RBM,包括:
确定所述DBN中各个RBM的顺序;
基于各个所述RBM的顺序,初始化每个所述RBM中的RBM参数;
将各个所述训练数据集依次输入各个所述RBM,并应用所述PSO算法调节各个所述RBM中的RBM参数达到最佳参数,所述DBN中各个已处理的RBM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211048113.X/2.html,转载请声明来源钻瓜专利网。