[发明专利]一种不同数据源的心电数据融合方法及装置在审
申请号: | 202110224552.0 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112989971A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 朱佳兵;朱涛 | 申请(专利权)人: | 武汉中旗生物医疗电子有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;A61B5/346 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 丁倩 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 不同 数据源 数据 融合 方法 装置 | ||
本发明涉及一种不同数据源的心电数据融合方法,包括以下步骤:从不同数据源中采集已经标注好初始标签的心电数据,建立心电数据集;对所述心电数据集中心电数据进行预处理;通过无监督的深度聚类对预处理后的心电数据集进行聚类,得到多个聚类簇;分别统计每一聚类簇的心电数据初始标签中各类标签的概率;基于概率统计结果对各聚类簇中心电数据进行融合,得到融合后的心电数据集。本发明能够对不同数据源的心电数据进行融合,去除噪声标签,便于后续模型的训练。
技术领域
本发明涉及心电数据分类标注处理技术领域,尤其涉及一种不同数据源的心电数据融合方法、装置及计算机存储介质。
背景技术
在实际心电数据采集过程中,我们采集的心电数据可能有多个来源,例如来自医院A、医院B或医院C。同一家医院的心电数据也有来自不同科室,比如住院部、心电图室、胸痛中心、体检中心、急诊中心等,也有可能来自基层医院,或120急救过程中。这些不同来源的心电数据中,既有静态12导联的,也有动态12导联的。这些数据往往在采样频率、信号质量、诊断结论书写方式和习惯上都存在一定的差别。以室性逸搏心律为例,有些年长的心电图医师会仍然沿用之前的习惯,将其标注为“室性逸搏心律”,而年轻的医师则可能将其标注为“室性自主心律”。目前,我们在处理因医生的个人分析水平不同和医院的知识传承所导致的“相似”心电图初始标签不一致的问题时,主要有两种处理方法:
1、首先去除心电数据中的初始标签,然后随机的分配给两名经验丰富的心电图医师,让他们独立地进行标注。如果两者标注结果不一致,则交给标注分歧仲裁人员进行后续处理;
2、先搭建一个心电图分类算法,可以是传统算法,也可以是神经网络算法,然后对心电数据进行预测。最后,比较模型输出的预测标签与初始标签,如果相同,则保留初始标签;否则,将相应心电数据交给医师进行二次标定。
第一种方法,在数据量较大时,标注所需的人力和财力成本很大。第二种方法,用于训练模型的数据是多源的,且是以初始标签为导向进行模型优化,而初始标签往往存在较大噪声,即可能因不同医院诊断标注的不统一、医师个人水平或某些心电图本身难判读等原因引起的标注错误,因此最终训练出的模型泛化能力有限,从而导致经模型筛选的需要医生进行二次标定的心电数据量较大。
发明内容
有鉴于此,有必要提供一种不同数据源的心电数据融合方法、装置及计算机存储介质,用以解决涉及多个数据源心电数据时,因噪声标签导致训练出的模型泛化能力差,从而使得需要二次标定的数据量大的问题。
本发明提供了一种不同数据源的心电数据融合方法,包括以下步骤:
从不同数据源中采集已经标注好初始标签的心电数据,建立心电数据集;
对所述心电数据集中心电数据进行预处理;
通过无监督的深度聚类对预处理后的心电数据集进行聚类,得到多个聚类簇;
分别统计每一聚类簇的心电数据初始标签中各类标签的概率;
基于概率统计结果对各聚类簇中心电数据进行融合,得到融合后的心电数据集。
进一步的,从不同数据源中采集已经标注好初始标签的心电数据,建立心电数据集,具体为:
从不同数据源中采集不同类别的心电数据,不同数据源中挑选出的同一类别的心电数据的数量在同一设定范围内,得到所述心电数据集。
进一步的,对所述心电数据集中心电数据进行预处理,具体为:
将所述心电数据转换为空间向量数据,用于提取心电数据的空间特征;
提取所述心电数据中第二导联数据,用于提取心电数据的时域特征;
获取所述心电数据的频谱图,用于提取心电数据的频域特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中旗生物医疗电子有限公司,未经武汉中旗生物医疗电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110224552.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置