[发明专利]一种基于体检报告聚类分析的疾病预测方法在审
申请号: | 201910240359.9 | 申请日: | 2019-03-27 |
公开(公告)号: | CN110136836A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 周凡 | 申请(专利权)人: | 周凡 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;A61B5/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 体检报告 疾病预测 体检 聚类分析 聚类算法 概率统计 联系信息 人力财力 使用机器 数据获得 诊断结果 疾病 估算 挖掘 分类 概率 拓展 应用 统计 健康 学习 | ||
本发明公开了一种基于体检报告聚类分析的疾病预测方法。本发明首先在体检报告上应用聚类算法分类,之后再统计每个类别中老体检报告后续诊断结果所反映的疾病种类及数量,估算同一类中新体检报告体检者患各种疾病的概率,进而进行疾病预测。本发明使用机器学习中的聚类算法,与传统概率统计处理方法比效果更佳,减轻了人力财力,且充分挖掘了海量体检数据以及数据间的深度联系信息;拓展了疾病预测的方案,使得体检者可以第一时间根据体检数据获得可能患病的信息,给出就诊或健康建议。
技术领域
本发明涉及机器学习及数据分析技术领域,具体涉及一种基于体检报告聚类分析的疾病预测方法。
背景技术
大数据时代已经到来,智慧医疗产业也在加速试水,体检报告智能化使健康体检有了更加优质、便捷、高效的体验。大数据的利用可对海量数据进行深度加工和挖掘,精细、动态和智慧的管理体检者的健康。健康大数据还提供具备实时知识产出能力的持续学习型基础设施,开发具有预防性、预测性和可参与性的医疗系统。体检报告智能化将能够提供全程健康医疗服务和管理,预测体检者健康隐患,对可能发生的疾病做到提前预警,给予干预和早期特异性治疗,降低患病风险。实现疾病预防诊疗的科学化管理。
大数据中包含的信息具有很高的价值。聚类分析将特征相近的空间实体划分为不同的组,使不同组间的差别尽可能大,同一组内的差别尽可能小。聚类分析在心理学研究中、生物学研究中和模式识别以及数据挖掘等领域中都起着重要的作用。
K-Medoids是常用的空间聚类算法,利用中心点(Medoids)作为聚类中心,有效排除了K-Means算法中异常值的影响。Kaufman和Rousseeuw在1990年提出的PAM(Partitioning Around Medoids)被认为是最有效K-Medoids算法之一。k-medoids聚类算法的基本策略是:首先为每个簇随意选择选择一个代表对象;剩余的对象根据其与代表对象的距离分配给近的一个簇。然后反复地用非代表对象来替代代表对象,以改进聚类的质量。PAM利用了贪婪搜索,不一定可以找到最优解,但是比穷尽搜索更快。PAM算法的优势在于:PAM算法比K-平均算法更健壮,对“噪声”和孤立点数据不敏感;它能够处理不同类型的数据点;它对小的数据集非常有效。
现有的技术有医院有关部门使用Excel软件利用传统概率统计知识进行体检报告的数据分析方法,具体步骤如下:
1.人为挖掘体检报告样本中各项指标的生化含义,找到不同体检项目间、体检项目与病理间的联系,挖掘统计学问题;
2.针对问题,使用简单的数学运算、统计、快速傅里叶变换、平滑和滤波、基线和峰值分析等对各项指标数据进行分析;
3.将分析的结果转化为信息,通常用方法有:各种图表工具,即排列图、因果图、直方图、分层图、调查表、散步图、控制图关联图、系统图、矩阵图等等。
这种方法的缺点在于:
1.只能做简单的概率统计学运算。不能较为全面地挖掘体检数据之间的联系及深层潜在的信息,如:无法实现每份体检报告基于各项指标相似性远近的自动分类。
2.只能处理较小的、数值型数据构成的数据集,不能处理海量、多维、混合数据类型的数据集。
3.传统方法分析海量数据费时费力,效率低下,效果不佳。
发明内容
本发明的目的是克服现有方法的不足,提出了一种基于体检报告聚类分析的疾病预测方法。本发明解决的问题主要有两个:一是如何利用聚类算法训练一个分类模型,可以使得海量的新老体检报告按照各自特征(主要是各体检项目指标数据)进行自动分类,其中主要的技术难点是体检各项指标的构成是混合型数据,以及如何评判聚类效果的好坏以矫正聚类算法的参数,从而达体检报告分类的最佳效果;二是如何根据聚类的结果进行疾病预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周凡,未经周凡许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910240359.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:体力劳动强度的确定方法、装置及电子设备
- 下一篇:一种医疗数据处理平台