[发明专利]提高医疗数值型数据矫正效率的方法、系统及存储介质在审
申请号: | 202110105147.7 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112768062A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李红良;张晓晶;折志刚 | 申请(专利权)人: | 武汉大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06Q10/06 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 唐万荣 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 医疗 数值 数据 矫正 效率 方法 系统 存储 介质 | ||
本发明公开了一种提高医疗数值型数据矫正效率的方法、系统及存储介质,该方法包括步骤:从多个机构的医疗数据中,提取待分析的数值型指标的数值数据;计算总体数据中和待分析机构中该指标的统计量;统计量包括均值、中位数范围、标准差;计算该机构的各个统计量与总体数据的差异比;设置多个差异比阈值,将该机构的各个统计量的差异比与每一个差异比阈值进行比较;每有一个统计量的差异比超过其中一个差异比阈值,则该机构累加1票;计算该指标下该机构的总票数;根据总票数判断数据是否异常并对异常数据进行矫正。本发明解决了健康医疗数据数据标准统一时的质量控制问题,帮助找出异常数据并进行矫正,降低数据治理的成本,提高数据治理的效率。
技术领域
本发明属于数据处理技术领域,具体涉及一种提高医疗数值型数据矫正效率的方法、系统及存储介质。
背景技术
近年来,医疗卫生信息化建设速度不断加快,医疗数据迅猛增长,数据开放共享趋势显著,数据的管理与应用面临着新的挑战和机会。医疗机构的医疗数据不可避免地存在数据缺失、数据错误、多机构数据标准不一致等问题。数据治理是对医疗行业数据质量控制、数据应用能力提升的有效方法。健康医疗数据的数据量巨大,人工一一核对、矫正、标化数据会消耗大量财力,时间和人力,也无法保证结果的准确性。这极大的增加了数据治理和数据应用的成本。
发明内容
本发明的目的在于,提供一种提高医疗数值型数据矫正效率的方法、系统及存储介质,对医疗数据中的数值型变量数据进行统计分析,找出异常数据并进行数据矫正,降低数据治理的成本,提高数据治理的效率。
本发明提供一种提高医疗数值型数据矫正效率的方法,包括以下步骤:
从多个医疗机构的医疗数据中,提取待分析的数值型指标的数值数据;
计算总体数据中该指标的统计量和待分析机构中该指标的统计量;统计量包括均值、中位数、标准差、第一四分位数和第二四分位数;
计算该机构的各个统计量与总体数据中同类型的统计量的差异比;
设置多个差异比阈值,将该机构的各个统计量的差异比与每一个差异比阈值进行比较;每有一个统计量的差异比超过其中一个差异比阈值,则该机构累加1票;
计算该指标下该机构的总票数;根据总票数判断该数值型指标的数值数据是否异常,并对异常数据进行数据矫正。
进一步地,在计算总票数之前,对该指标的总体数据进行正态检验,判断该指标的总体数据是否符合正态分布;
若是,则将该指标下该机构中的数据与总体数据进行T检验,得到第一P值;若否,则进行非参数检验,得到第二P值;
判断得到的P值是否小于预设阈值;若是,则该机构累加1票。
进一步地,计算该指标下各机构的总票数。
进一步地,最后利用箱线图或密度图的方法,将该指标下各机构的数据和总体数据可视化,辅助查找异常数据。
进一步地,统计量的差异比K的计算公式如下:
K=|tmp-All|/All
式中,tmp表示机构中该指标的统计量,All表示总体数据中该指标的统计量。
进一步地,从多个机构的医疗数据中,并行提取待分析的数值型指标的数值数据,并行计算总体数据中该指标的统计量和待分析机构中该指标的统计量。
本发明还提供一种用于实现上述提高医疗数值型数据矫正效率的方法的提高医疗数值型数据矫正效率的系统,包括:
数据提取模块,用于从多个医疗机构的医疗数据中,提取待分析的数值型指标的数值数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110105147.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置