[发明专利]肺结节检测模型训练方法、检测方法及装置在审
申请号: | 202011025660.7 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112132815A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 张玉兵;王静雯 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结节 检测 模型 训练 方法 装置 | ||
本发明公开了一种肺结节检测模型训练方法、检测方法及装置。基于半监督学习方法训练肺结节检测模型,减少了训练肺结节检测模型所需的标注数据的数量,进而降低了标注成本。此外,通过计算各结节特征之间的连接矩阵,基于连接矩阵构建图卷积神经网络,利用图卷积神经网络充分挖掘标注数据和未标注数据之间的共性特征,能够提高肺结节检测模型的检测精度。
技术领域
本发明实施例涉及机器学习技术领域,尤其涉及一种肺结节检测模型训练方法、检测方 法及装置。
背景技术
受环境、吸烟以及遗传等因素的影响,肺癌是我国死亡率和发病率最高的恶性肿瘤。根 据医学数据显示,早期肺癌5年生存率显著高于中晚期肺癌,早发现、早诊断和治疗是改善 肺癌的重要途径。
判断肺部是否存在肺结节是判定癌症的一项有力指标,因此肺结节的早期筛查变得尤为 重要。其中,胸部低剂量CT图像具有分层薄、视野清晰、干扰因素少等特点,因此,基于 肺部CT图像检测肺结节是目前国际公认的有效手段。随着计算机人工智能的发展,深度学 习越来越多的应用到CT图片的分析中,这可以减轻医生工作负担。
但现有的肺结节深度学习检测算法采用监督学习框架,训练样本需要预先进行人工标注。 而深度学习模型参数量动辄上百万,为防止过拟合,需要大量的训练样本,即训练一个有效 的深度学习检测模型,需要大量的人工标注样本。而一个薄层胸部CT序列包含200-500张 图像,逐层查看标注耗时长,为保证标注质量,需要标注者是具有丰富经验的影像科医生, 并采取多盲标注的策略,消除医生偏好并降低漏标。因此,肺部CT图像的肺结节标注极为 困难、对标注者要求高,即标注成本很高。
发明内容
本发明提供一种肺结节检测模型训练方法、检测方法及装置,以降低标注成本,提高肺 结节检测模型的检测精度。
第一方面,本发明实施例提供了一种肺结节检测模型训练方法,包括:
以标注数据为样本训练肺结节检测模型,所述标注数据包括多张带有标签的第一肺部CT 图像样本,所述标签用于标示所述第一肺部CT图像样本是否存在肺结节;
将所述标注数据和未标注数据输入所述肺结节检测模型,得到各肺部CT图像样本的结 节特征,所述未标注数据包括多张不带标签的第二肺部CT图像样本;
计算各所述结节特征之间的连接矩阵,所述连接矩阵用于表示各所述结节特征之间的连 接关系;
基于所述连接矩阵构建图卷积神经网络;
以所述标注数据中各第一肺部CT图像样本的结节特征为样本训练图卷积神经网络;
将所述未标注数据的结节特征输入所述图卷积神经网络中进行处理,确定各所述第二肺 部CT图像样本的伪标签;
以所述标注数据和带伪标签的未标注数据为样本,重新训练所述肺结节检测模型。
第二方面,本发明实施例还提供了一种肺结节检测方法,采用如本发明第一方面提供的 肺结节检测模型训练方法训练得到的肺结节检测模型,包括:
获取待检测的肺部CT图像;
将所述肺部CT图像输入所述肺结节检测模型中进行处理,得到所述肺部CT图像存在 肺结节的概率。
第三方面,本发明实施例还提供了一种肺结节检测模型训练装置,包括:
第一训练模块,用于以标注数据为样本训练肺结节检测模型,所述标注数据包括多张带 有标签的第一肺部CT图像样本,所述标签用于标示所述第一肺部CT图像样本是否存在肺 结节;
结节特征提取模块,用于将所述标注数据和未标注数据输入所述肺结节检测模型,得到 各肺部CT图像样本的结节特征,所述未标注数据包括多张不带标签的第二肺部CT图像样 本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011025660.7/2.html,转载请声明来源钻瓜专利网。