[发明专利]数据标注处理方法及装置、系统有效
申请号: | 202011602759.9 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112579808B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 赵明 | 申请(专利权)人: | 上海赛图默飞医疗科技有限公司 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06V10/764;G06V10/82;G06N3/0464;G06N3/08;G06T7/11;G16H30/20 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 程华 |
地址: | 201805 上海市嘉定区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 标注 处理 方法 装置 系统 | ||
本申请公开了一种数据标注处理方法及装置、系统。其中,该方法包括:获取血液样本图像,并对血液样本图像进行预处理,得到白细胞图像;利用神经网络模型对白细胞图像进行分类,得到白细胞的分类结果;获取分类结果是否正确的判断结果,如果判断结果指示分类结果正确,保存白细胞图像以及分类结果;如果判断结果指示分类结果不正确,获取对白细胞图像的正确标注结果,其中,正确标注结果是目标用户在客户端对白细胞图像进行人工分类标注得到的。本申请解决了由于目前血液细胞图像的标注需要标注人员拥有专业的医学知识和经验,导致人力成本和时间成本较高,并且标注效率较低,错误率较高的技术问题。
技术领域
本申请涉及数据标注领域,具体而言,涉及一种数据标注处理方法及装置、系统。
背景技术
白血病的主流诊断手段包括细胞形态学诊断和基因分析诊断。其中,血细胞形态分析只需要一张图像,而不是血液样本,因此适用于低成本或远程的诊断系统。利用图像处理和深度学习的计算机辅助形态分析系统可以用较低的时间成本和人力成本来完成白血病的诊断。
通过白细胞亚型分类,可以得到初步的诊断结论。白细胞可以分成17种不同的类型,一些白细胞类型,从外表上看比较容易分辨,而又一些白细胞的类型从细胞形态,细胞核大小比例等方面来看,都基本无法分辨。例如,幼粒细胞细分为早幼粒细胞,中幼粒细胞,晚幼粒细胞。幼粒细胞的三个阶段的细胞形态和结构是十分相似的,只有经过专业培训的血液学专家在可以分辨。精确判断早幼粒细胞,对于诊断急性早幼粒细胞白血病具有十分重要的意义。
所以基于细胞形态学进行白血病诊断,需要精确的知道血液样本中的白细胞分别属于哪个亚型。白细胞亚型分类是一个有层次结构的分类问题,并且深度学习依赖于大量标注的数据。所以,使用深度学习完成白细胞亚型分类任务,需要有海量的有亚型标注的白细胞图像数据。对于白血病诊断来说,如果需要一个高精度的深度学习模型,至少需要1万张的带标注的血液细胞图像数据。但是由于医学图像的特殊性,通常只有经过专业培养的血液科医生才能够精确且可靠的对血液细胞图像进行分类和标注。进行大量的医学图像标注需要投入专业医生的大量的时间和精力,使得人力成本和时间成本很高。所以,如何设计一个标注系统,并降低数据标注的人力成本和时间成本,成为了一个非常重要的问题。
一个典型的图像标注系统一般包括数据采集和数据标注两个部分。其中依赖标注人员对于采集的数据进行标注。但是针对医疗图像特别是血液细胞的标注,需要标注人员拥有专业的医学知识和经验。所以进行大量的医学图像标注需要投入专业医生的大量的时间和精力,使得人力成本和时间成本很高。而且白细胞亚型分类是一个多层次结构的分类问题,分类种类多,部分亚型及其相似,所以标注的复杂和难度很高,即使在专业医生的帮助下,整体的标注效率较低,错误率较高。
针对由于目前血液细胞图像的标注需要标注人员拥有专业的医学知识和经验,导致人力成本和时间成本较高,并且标注效率较低,错误率较高的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种数据标注处理方法及装置、系统,以至少解决由于目前血液细胞图像的标注需要标注人员拥有专业的医学知识和经验,导致人力成本和时间成本较高,并且标注效率较低,错误率较高的技术问题。
根据本申请实施例的一个方面,提供了一种数据标注处理方法,包括:获取血液样本图像,并对血液样本图像进行预处理,得到白细胞图像;利用神经网络模型对白细胞图像进行分类,得到白细胞的分类结果;获取分类结果是否正确的判断结果,如果判断结果指示分类结果正确,保存白细胞图像以及分类结果;如果判断结果指示分类结果不正确,获取对白细胞图像的正确标注结果,其中,正确标注结果是目标用户在客户端对白细胞图像进行人工分类标注得到的。
可选地,获取分类结果是否分类正确的判断结果之前,方法还包括:将分类结果和白细胞图像发送至客户端;判断结果是目标用户在客户端依据白细胞图像和分类结果判断得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海赛图默飞医疗科技有限公司,未经上海赛图默飞医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011602759.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置