[发明专利]一种基于机器学习的WSI病灶区域自动标注方法及系统有效
申请号: | 201910656071.X | 申请日: | 2019-07-19 |
公开(公告)号: | CN110378885B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 宣宁;王晓骁;尹荣;刘文弟;史丹;王洁 | 申请(专利权)人: | 王晓骁;宣宁 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G16H30/20;G06V10/764;G06V10/44;G06V10/26;G06V10/82;G06N3/0464;G06N3/09 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王恒静 |
地址: | 210029 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 wsi 病灶 区域 自动 标注 方法 系统 | ||
本发明公开一种基于机器学习的WSI病灶区域自动标注方法及系统,该方法包括:(1)采集WSI图像数据集,所述数据集中的WSI图像包括无病灶区域的和有病灶区域的生理组织切片,对所述数据集中的所有WSI图像进行预处理,所述预处理包括;(2)对采集的初始训练样本集进行数据增量,形成最终训练样本集,并将部分样本载入构建的卷积神经网络模型中对所述模型进行迭代训练,得到最终预测模型;(3)载入最终训练样本集的剩余样本到所述最终预测模型中,通过样本中的WSI输出标注病灶区域的热度图。本发明经过自动的、大量的深度训练后,可以在杂乱的数据中找到更抽象高层特征,也更具有代表性的特征,从而提高病理看片效率和现有自动检测的准确度。
技术领域
本发明涉及对WSI病灶区域自动标注技术领域,具体涉及一种基于机器学习的WSI病灶区域自动标注方法及系统。
背景技术
病理切片一直都是疾病诊断的金标准,随着医疗资源的普及和诊断需求量的增加,病理切片的诊断量不断增加。传统检测方法是人工检测,而一张全场扫描数字病理图像(WSI)切片往往平均超过千兆像素,面对大量的病理切片需要病理医师花费大量时间精力。人工检测的准确性由病理医师的经验、状态等因素影响,导致检测质量无法在单体及群体中保持一致。常规自动检测中的定量分析采用了人为选择的视觉特征(颜色、灰度值、结构、纹理等)对WSI图像进行检测。人为选择的视觉特征往往不能覆盖所有的有效特征,忽略了细胞组织的复杂度,从而无法提高检测精准度达到应用级别。
发明内容
发明目的:为了克服现有技术的不足,本发明提供一种基于机器学习的WSI病灶区域自动标注方法,该方法可以解决病理医生负担重、人工看片效率低、现有自动检测准确率低的问题,本发明还提供一种基于机器学习对WSI的病灶区域自动标注系统。
技术方案:本发明所述的基于机器学习的WSI病灶区域自动标注方法,该方法包括:
(1)采集WSI图像数据集,对所述数据集中的所有WSI图像进行预处理,所述预处理包括:
对WSI图像进行染色后,在LAB色彩空间创建生理组织蒙版;
使用Chase-Vese的主动轮廓模型优化所述生理组织蒙版的边缘,确定含有生理组织切片;
对所述含有生理组织的切片进行病灶区域的人工标注;
对标注后的含有病灶区域的生理组织的切片以及没有病灶区域的生理组织切片进行分割,得到若干含有生理组织的小块后,采集若干病灶小块和正常小块,并均加入到初始训练样本集中;
(2)对采集的初始训练样本集进行数据增量,形成最终训练样本集,并将部分样本载入构建的卷积神经网络模型中对所述模型进行迭代训练,得到最终预测模型;
(3)载入最终训练样本集的剩余样本到所述最终预测模型中,通过样本中的WSI输出标注病灶区域的热度图。
进一步地,包括:
所述步骤(1)中,含有生理组织的小块需满足生理组织的面积覆盖率不小于设定阈值ε。
进一步地,包括:
所述步骤(1)中,病灶小块为病灶区域大于等于像素阈值δ的含有生理组织的小块,所述正常小块为病灶区域小于像素阈值δ的含有生理组织的小块。
进一步地,包括:
所述阈值ε的范围为[30%,70%],阈值δ的范围为[5%,70%]。
进一步地,包括:
所述对标注后的含有病灶区域的生理组织的切片以及没有病灶区域的生理组织切片进行分割,得到若干小块后,采集若干病灶小块和正常小块,并加入到初始训练样本集,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王晓骁;宣宁,未经王晓骁;宣宁许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910656071.X/2.html,转载请声明来源钻瓜专利网。