[发明专利]模型训练方法及神经网络模型、图片分类方法及系统在审
申请号: | 202210674951.1 | 申请日: | 2022-06-15 |
公开(公告)号: | CN114897166A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 曾祥云;朱姬渊 | 申请(专利权)人: | 上海易康源医疗健康科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06V10/82;G06V10/764 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 杨用玲 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 神经网络 图片 分类 系统 | ||
1.一种模型训练方法,其特征是,包括步骤:
S1:构建训练模型,所述训练模型包括第一神经网路和第二神经网路;
S2:分别将训练信息输入至第一神经网路和第二神经网路:
S3:将第一神经网路的特征注意力进行集成处理;
S4:将第一神经网络的注意力机制迁移至第二神经网路;
S5:分别对第一神经网络、第二神经网络进行更新。
2.如权利要求1所述的模型训练方法,其特征是,S3:将第一神经网路的特征注意力进行集成处理包括:
所述第一神经网络包括若干个特征层,对当前特征层的通道进行压缩处理;
对当前特征层压缩后的通道进行还原处理;
将还原得到的特征映射到0-1之间,得到当前特征层的加权特征;
将当前特征层的加权特征作为下一特征层的输入;
将当前特征层进行降采样处理,并与下一特征层进行压缩处理后得到的特征进行拼接;
将拼接得到的特征进行还原处理并映射到0-1之间,得到下一特征层的加权特征。
3.如权利要求2所述的模型训练方法,其特征是,将还原得到的特征或者拼接得到的特征映射到0-1之间,使用的映射函数为sigmoid函数。
4.如权利要求1所述的模型训练方法,其特征是,S4:将第一神经网络的注意力机制迁移至第二神经网路包括:
将第一神经网络和第二神经网络设置相同的的特征层数;
将第一神经网路的各个特征层的输出通道进行压缩或者提升处理,得到与第二神经网络的对应特征层的特征通道数相同;
第一神经网路的特征层和对应第二神经网络的特征层之间均采用L2损失函数进行计算。
5.如权利要求1所述的模型训练方法,其特征是,S5:分别对第一神经网络、第二神经网络进行更新包括:
将第一神经网络中各个特征层的损失进行相加,进行误差反向传播,并更新参数;
将第二神经网络中各个特征层的损失进行相加,进行误差反向传播,并更新参数。
6.一种神经网络模型,包括第一神经网路和第二神经网路、迁移模块,其中:
第一神经网路、第二神经网络分别用以对输入的信息进行特征提取;
迁移模块用以将第一神经网络的知识传递给第二神经网络;
其特征是,所述神经网络模型的训练方法为1至5之任一模型训练方法。
7.一种图片分类方法,包括步骤:
接收输入的图片;
神经网络模型对图片进行分析并分类;
返回输出结果,
其特征是,所述神经网络为权利要求1至5之任一模型训练方法得到的神经网络模型。
8.一种图片分类系统,包括交互单元、处理模块,其中:
交互单元用以接收输入的图片;
处理模块用以对输入的图片进行处理并向交互单元返回分类结果,
其特征是,所述处理模块为权利要求1至5之任一模型训练方法得到的神经网络模型。
9.一种计算机可读存储介质,所述存储介质中存储有指令或者程序,其特征是,所述指令或者程序由处理器加载并执行如权利要求8所述的图片分类方法。
10.一种电子设备,其特征是,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求8所述的图片分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海易康源医疗健康科技有限公司,未经上海易康源医疗健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210674951.1/1.html,转载请声明来源钻瓜专利网。