[发明专利]基于多级迭代的乳腺癌病理图像中有丝分裂自动检测方法有效
申请号: | 202110183836.X | 申请日: | 2021-02-08 |
公开(公告)号: | CN112884737B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 刘娟;陈玉琦;冯晶 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/136;G06T7/155;G06T7/60;G06T7/90;G06V10/44;G06V10/56;G06V10/764;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多级 乳腺癌 病理 图像 有丝分裂 自动检测 方法 | ||
1.一种基于多级迭代的乳腺癌病理图像中有丝分裂自动检测方法,其特征在于:该方法将有丝分裂的检测转换为对有丝分裂与非有丝分裂的分类进行实现,包含以下步骤:
S1:从乳腺癌组织病理图像的高视野区域中筛选出有丝分裂与非有丝分裂候选集;
S2:利用数据增强技术对训练集中的有丝分裂候选集进行数据增强,增加训练集中有丝分裂的数据量;
S3:搭建深度神经网络分类模型,记为模型A,随机初始化模型A的参数;
S4:为训练模型A指定训练轮数L,将步骤S2中训练集放入步骤S3中搭建的深度神经网络中进行训练,保存验证集中F1值最高一轮的值及参数;
S5:再次进行模型A的训练,指定相同的轮数L,将前一步保存的参数作为初始化参数重新放入步骤S3搭建的深度神经网络中再次进行L轮的训练,保存该次训练中验证集最高的F1值及相关参数;
S6:将步骤S5保存的F1值与步骤S4中保存的F1值进行比较,如果步骤S5的F1值没有提高,则停止训练;如果步骤S5的F1值提高,则重复进行步骤S5,直至步骤S5的验证集中F1值不再提高;
所述步骤S1从乳腺癌组织病理高视野区域图筛选出发生有丝分裂与没有发生有丝分裂的候选集,步骤包含:
利用细胞核定位技术确定细胞核的中心坐标,以中心坐标为中心进行正方块切片,所述切片按照病理医生的标注信息形成有丝分裂和非有丝分裂候选集;
所述细胞核定位技术,步骤包含:
先将组织病理图像的RGB颜色空间转换成HED颜色空间,转换后提取H通道信息进行二值化处理,经过腐蚀膨胀形成的连通区域划定矩形框,以矩形框的中心作为细胞核的中心坐标;
所述步骤S3中深度神经网络分类模型的搭建如下:
所述深度神经网络分类模型,记该模型为模型A,具体结构如下:首先使用ResNet50作为特征提取模块,其中最后一层全连接层的输出维度改为100,后面带着一层激活函数Relu的激活层和一层Dropout函数的线性层,以及一个二分类的线性分类模块;
ResNet50的主要思想为使用残差学习,残差学习的目标函数分为两部分:恒等函数和残差函数,公式如下:
h(x)=x+(h(x)-x);
其中x表示恒等函数;
Relu表达形式如下:
f(u)=max(0,u);
其中u表示输入的数据;该函数实现所有负值都变为0,而正值不变,意味着同一时间只有部分神经元会被激活,从而使得网络很稀疏,增强计算效率;
Dropout函数的作用防止模型过拟合,具体方法为:在前向传播的时候让神经元的激活值以p的概率停止工作;
所述细胞核定位技术,具体步骤如下:
1)将图像的RGB颜色空间转化为Haematoxylin-Eosin-DAB(HED)颜色通道:
经过染色的组织病理图像是基于组织结构在不同染色剂下光的吸收程度不同的原理制作而成的,其吸收度和染色剂之间满足比尔朗伯定律,其公式为:
IC=I0,Cexp(-A·cC);
其中下标C表示通道,I0,C表示入射光强度,IC通过样本后的通道为C的光强度,A表示染色剂的量,cC表示某种染色依赖于该通道的吸收系数;
在光学密度空间中分离不同颜色的染色分量,计算RGB每个颜色通道光学密度的公式为:
ODC=-log10(IC/I0,C)=A*cC;
每种染色剂在R、G、B三个通道有相应的光学密度值,用3*1的OD向量表示;三种混合染色的颜色系统记为:
每一行对应每种染色剂,每一列对应每种染色剂分别在R、G、B通道下的光密度,称这个矩阵为OD矩阵;对M进行正交变换得到每种染色的独立信息,然后对其标准化得到每种染色正确的吸收系数,对Mt进行正交变换和标准化的矩阵记为Mt;
光学密度向量满足公式y=CMt,其中C为1*3的向量,表示某个像素点的三种染色量,y为光学密度向量;计算颜色去卷积矩阵D=Mt-1,根据C=yD得到每个染色通道的信息;提取出H通道的信息,该通道的矩阵记为K;
2)对H通道的图像K根据以下公式进行变换:
3)对变换后的图像Kt进行二值化处理,细胞核区域置为白色;
4)对二值化后的图像进行腐蚀膨胀,得到连通区域;
5)找到每个白色区域的四个边缘点,以四个边缘点作为矩形框的边缘位置使每个连通区域形成一个矩形框,计算每个矩形框的中心点位置,得到每个细胞核的中心点坐标,这些中心点坐标记为集合Q。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110183836.X/1.html,转载请声明来源钻瓜专利网。