[发明专利]医疗数据预处理方法、装置和电子设备在审

专利信息
申请号: 201910034052.3 申请日: 2019-01-15
公开(公告)号: CN111435613A 公开(公告)日: 2020-07-21
发明(设计)人: 郭晓方;金敏;刘颖丰;徐长水;雷锦誌 申请(专利权)人: 金敏
主分类号: G16H50/30 分类号: G16H50/30;G16H10/60
代理公司: 北京彩和律师事务所 11688 代理人: 张红春
地址: 100840 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 医疗 数据 预处理 方法 装置 电子设备
【说明书】:

公开了一种医疗数据预处理方法、装置和电子设备。该医疗数据预处理方法包括:对获取的与客户相关的原始医疗数据进行数据清理处理,以获得经过数据清理之后的已清理医疗数据;对所述已清理医疗数据进行归一化处理,以获得经过归一化处理之后的已归一化医疗数据;以及,对所述已归一化医疗数据进行异常值处理,以获得经过异常值处理之后的训练医疗数据,其中,所述训练医疗数据用于录入至模型训练表中,且所述模型训练表构成训练集,用于对癌症预测模型进行训练。这样,可节省数据分析过程中的大量时间和空间,并且,更能够确保数据的准确性和适用性,以使得基于癌症预测模型所获得的癌症预测结果具有更好的决策和预测作用。

技术领域

本申请涉及数据处理领域,特别是涉及医疗数据预处理方法、医疗数据预处理装置和电子设备。

背景技术

癌症是中国人口的主要死亡因素之一。有数据显示,2015年中国人口预期癌症新发病例总数为429.2万,预期死亡人数281.4万。也就是说,每分钟就有8个人被确诊为癌症,有5个人因癌症而离世,中国人一生患癌症风险高达22%。癌症是一种难以治愈的疾病,根据国家癌症中心最新数据显示,恶性肿瘤5年生存率为40.5%,2015年数据显示更低为36.9%。

有数据显示:癌症如果发现的早,治愈率非常高。并且,国内外研究实现证明癌症患者与健康人之间的临床医疗数据(例如,血尿化验数据)存在明显差异。血尿检查将逐渐成为癌症筛查的重要手段。

虽然,获取常规的健康体检或癌症病患的血尿化验数据并非难事,但并不是所有获取的数据都是有效的,通常采集到的大多数健康体检数据是参差不齐的,存在缺失项、单位错误、数量级不同等缺陷。这给后续基于临床医疗数据的癌症预测分析带来了极大的麻烦。

因此,需要一种有效的对获取的医疗数据进行预处理的技术方案,以便于后续的数据分析和数据挖掘。

发明内容

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种医疗数据预处理方法、医疗数据预处理装置和电子设备,其通过对获取的与客户相关的原始医疗数据进行数据清洗处理、归一化处理和异常值处理,以获得用于对癌症预测模型训练的数据集。通过这样的方式,可节省数据分析过程中的大量时间和空间,并且,更能够确保数据的准确性和适用性,以使得基于所述癌症预测模型所获得的癌症预测结果具有更好的决策和预测作用。

根据本申请的一方面,提供了一种医疗数据预处理方法,包括:对获取的与客户相关的原始医疗数据进行数据清理处理,以获得经过数据清理之后的已清理医疗数据;对所述已清理医疗数据进行归一化处理,以获得经过归一化处理之后的已归一化医疗数据;以及,对所述已归一化医疗数据进行异常值处理,以获得经过异常值处理之后的训练医疗数据,其中,所述训练医疗数据用于录入至模型训练表中,且所述模型训练表构成训练集,用于对癌症预测模型进行训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金敏,未经金敏许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910034052.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top