[发明专利]卷积神经网络的训练方法和病灶分割方法在审
申请号: | 202011634830.1 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112561918A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 付娆;李峰;苏畅;程剑;李坤艳 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/08;G06N3/04 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 训练 方法 病灶 分割 | ||
1.一种卷积神经网络的训练方法,所述卷积神经网络包括输入层、中间层和输出层;
其特征在于,所述训练方法包括:
初始化所述中间层的网络参数;
基于所述输入层接收的训练样本图片,前向传播计算所述卷积神经网络的期望输出;
计算所述期望输出和所述输出层接收的所述训练样本图片对应的标签之间的误差;
反向传播所述误差,并更新所述中间层的网络参数;
采用交叉熵函数和Dice函数结合成的Dice-CE函数对所述误差进行损失评估;
在所述误差被评估为损失最小时,对应的所述中间层的网络参数作为所述卷积神经网络的最终参数。
2.根据权利要求1所述的卷积神经网络的训练方法,其特征在于,所述Dice-CE函数为,LDice-E=-(αLCE+(1-α)·LDice),其中0<α<1,LCE为所述交叉熵函数,LDice为所述Dice函数。
3.根据权利要求2所述的卷积神经网络的训练方法,其特征在于,所述交叉熵函数表示为:
其中,0<β<1,N为所述训练样本图片的总数,In表示自然对数;ytrue为所述标签,ypred为所述期望输出。
4.根据权利要求2所述的卷积神经网络的训练方法,其特征在于,所述Dice函数表示为:
其中,N为所述训练样本图片的总数,ytrue为所述标签,ypred为所述期望输出。
5.根据权利要求1至4任一项所述的卷积神经网络的训练方法,其特征在于,所述中间层划分为:第一块A0、第二块A1、第三块A2和第四块A3;
其中,所述输入层接收到的训练样本图片经所述第一块进行第一次特征提取,得到第一特征图片;
所述第一特征图片经所述第二块进行第二次特征提取,得到第二特征图片;
所述第二特征图片经所述第三块进行第三次特征提取,得到第三特征图片;
所述第三特征图片经所述第四块进行第四次特征提取,得到第四特征图片;
所述前向传播计算所述卷积神经网络的期望输出,包括:
基于所述第二特征图片、所述第三特征图片和所述第四特征图片,分别计算第一预测值、第二预测值和第三预测值;
所述计算所述期望输出和所述输出层接收的所述训练样本图片对应的标签之间的误差,包括:
分别计算所述第一预测值、所述第二预测值和所述第三预测值与所述标签之间的第一偏差、第二偏差和第三偏差;
所述第一偏差、所述第二偏差和所述第三偏差相乘,得到所述误差。
6.根据权利要求5所述的卷积神经网络的训练方法,其特征在于,所述初始化所述中间层的网络参数,包括:
构建包括第一自编码器、第二自编码器和第三自编码器的栈式自编码器;
将所述训练样本图片输入到所述第一自编码器,训练所述第一块和所述第二块的网络参数,并用训练好的所述第一块和所述第二块的网络参数算出所述第一自编码器的输出;
将所述第一自编码器的输出作为所述第二自编码器的训练样本,输入到所述第二自编码器,训练所述第三块的网络参数,并用训练好的所述第三块的网络参数算出所述第二自编码器的输出;
将所述第二自编码器的输出作为所述第三自编码器的训练样本,输入到所述第三自编码器,训练所述第四块的网络参数,并用训练好的所述第四块的网络参数算出所述第三自编码器的输出;
将训练好的所述第一块、所述第二块、所述第三块和所述第四块的网络参数作为所述第一块、所述第二块、所述第三块和所述第四块的网络参数的初值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011634830.1/1.html,转载请声明来源钻瓜专利网。