[发明专利]一种基于多尺度空洞卷积的乳腺癌病理图片分类方法有效
申请号: | 202110301564.9 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112950614B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 潘晓光;张娜;陈亮;张雅娜;马文芳 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T3/40;G16H30/20;G16H30/40;G06N3/04;G06N3/08 |
代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
地址: | 030006 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 空洞 卷积 乳腺癌 病理 图片 分类 方法 | ||
1.一种基于多尺度空洞卷积的乳腺癌病理图片分类方法,其特征在于:包括下列步骤:
S100、数据收集:采集各期乳腺癌病理X光图片并标注对应标签;
S200、数据预处理:对数据进行缩放,增强以及归一化处理;
将所有数据图像进行缩放,缩放后每张图像的大小为800*800px;使用数据增强的方式对数据集进行扩增,数据增强方式为数据旋转,对病理图像分别进行90度,180度,270度旋转,并保留数据标签;对所有数据除以255以进行归一化,公式为:
,
x为处理前像素点的像素值,x′ 为归一化后该像素点的像素值;
S300、数据集构建:混合数据并随机打乱,构建标准化深度学习数据集;
S400、数据集划分:构建数据训练集、测试集与验证集;
S500、模型构建:构建以空洞卷积为基础的多尺度卷积神经网络,网络由CNN层、多尺度空洞卷积层、全连接层构成;
以空洞卷积机制为基础,构建多尺度卷积神经网络,多尺度卷积神经网络分为3部分,第一部分为普通CNN层,对数据进行较为粗略的特征提取,筛选重要特征,过滤无用特征;第二层为多尺度空洞卷积层,采用多尺度的空洞卷积,对数据特征进行进一步的不同感受野的提取,对数据特征进行更加深入全面的分析;第三层为全连接分类层,对提取到的特征进行最终分类,得到分类结果;
所述普通CNN层由3层CNN网络构成,每层包含卷积层、池化层与BN层,3层CNN网络最后进行一次批量归一化,使得非线性变换函数的输入值落入对输入比较敏感的区域,避免梯度消失,该部分的卷积核大小为5*5,步长为2,采用valid方式进行卷积,池化层采用大小为2*2的最大值池化,步长为1,采用ReLU作为激活函数对数据特征进行非线性处理,帮助网络更好地进行特征拟合,ReLU公式为:
,
其中x为输入的特征值,f(x)为经过ReLU激活后的特征值;
所述多尺度空洞卷积层采用5个不同尺度的卷积核,其中3个进行空洞卷积,2个进行普通卷积,3个空洞卷积的卷积核大小分别为5*5、5*5、3*3,空洞间隔分别为2、1、1,2个普通卷积的卷积核大小分别为3*3与1*1,卷积步长全部为1,采用same方式进行卷积,将5个卷积获得的特征进行concate,得到高维度多尺度特征;
所述全连接层将前两层模型提取得到的特征进行全连接分类,使用softmax将结果输出,得到对数据的分类结果;
S600、模型训练:采用训练参数对模型进行迭代训练;
网络搭建完毕后使用训练集数据对网络参数进行训练,采用Adam作为优化器,初始学习率为0.01,每100个epoch学习率衰减80%,batch size大小为32,损失函数使用softmax_cross_entropy,设定训练500个epoch,连续20个epoch模型损失值无下降则停止训练,保存模型,使用验证集数据对训练的到的数据模型进行200个epoch的二次训练,若模型损失无下降,保存模型,若模型损失降低,使用训练集数据继续对模型进行训练,直到模型损失稳定。
2.根据权利要求1所述的一种基于多尺度空洞卷积的乳腺癌病理图片分类方法,其特征在于:所述S100数据收集中,收集各期乳腺癌患者相关X光病理图像数据与无患病者乳腺X光图像数据,由专业医师分别诊断,保证数据标签的正确性。
3.根据权利要求1所述的一种基于多尺度空洞卷积的乳腺癌病理图片分类方法,其特征在于:所述S300数据集构建中,将收集到的乳腺癌图像数据、未患病图像数据与扩增所得图像数据混合并随机打乱,完成标准化数据集构建。
4.根据权利要求1所述的一种基于多尺度空洞卷积的乳腺癌病理图片分类方法,其特征在于:所述S400数据集划分中,以7:1:2的比例将数据集划分为训练集、验证集与测试集。
5.根据权利要求1所述的一种基于多尺度空洞卷积的乳腺癌病理图片分类方法,其特征在于:还包括:S700、模型评价:采用准确率与召回率对模型识别效果进行评估,使用训练完成的模型对测试集数据进行测试,根据模型识别结果与数据标签,对模型识别效果进行评估,评估方式为对每一个类别的数据进行准确率与召回率的计算,计算公式为:
准确率:Acc=(TP+TN)/(TP+TN+FN+FP);
召回率:R=TP/(TP+FN);
其中TP为正类判定为正类数量,FP为负类判定为正类数量,FN为正类判定为负类数量,TN为负类判定为负类数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110301564.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种同轴多输出舵机和输出方法
- 下一篇:三层式组合软板自动上料定位装置