[发明专利]一种基于体检报告聚类分析的疾病预测方法在审
申请号: | 201910240359.9 | 申请日: | 2019-03-27 |
公开(公告)号: | CN110136836A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 周凡 | 申请(专利权)人: | 周凡 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;A61B5/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于体检报告聚类分析的疾病预测方法。本发明首先在体检报告上应用聚类算法分类,之后再统计每个类别中老体检报告后续诊断结果所反映的疾病种类及数量,估算同一类中新体检报告体检者患各种疾病的概率,进而进行疾病预测。本发明使用机器学习中的聚类算法,与传统概率统计处理方法比效果更佳,减轻了人力财力,且充分挖掘了海量体检数据以及数据间的深度联系信息;拓展了疾病预测的方案,使得体检者可以第一时间根据体检数据获得可能患病的信息,给出就诊或健康建议。 | ||
搜索关键词: | 体检报告 疾病预测 体检 聚类分析 聚类算法 概率统计 联系信息 人力财力 使用机器 数据获得 诊断结果 疾病 估算 挖掘 分类 概率 拓展 应用 统计 健康 学习 | ||
【主权项】:
1.一种基于体检报告聚类分析的疾病预测方法,其特征在于,所述方法包括:步骤一,从医院数据库中获取体检报告,以及这些报告所有者的后续诊断结果,组成体检报告数据库。并将数据集划分训练集和测试集;步骤二,运用统计学方法将体检报告依据后续诊断疾病类型分为K类,也即为聚类簇中心数K,可以有多个K值备选;步骤三,针对体检项目的不同数据类型及数量单位,对数据集体检报告各项目数据进行标准化处理,最终得到标准化后的数据矩阵,之后初始化权重参数W;步骤四,用权重参数W和运用欧氏距离公式计算标准化后的数据矩阵间的相异性矩阵D;步骤五,利用聚类算法根据相异性矩阵D进行体检报告的聚类,使得数据集体检报告被分到K个簇;步骤六,根据测试集里面被错误分类的体检报告的数量来计算测试集数据的损失值Ltest大小;步骤七,调整权重参数W后重复步骤四~六,直至损失值Ltest最小,即得到当前K值下的最优聚类模型;步骤八,更换K值,重复步骤五~七,将体检报告聚到K个不同的类别;步骤九,计算每一个K值下的轮廓系数,以及考虑损失值Ltest大小,来确定最佳的聚类个数K,选出最优聚类模型;步骤十,拿需要被分类的没有诊断结果的体检报告,用训练好的模型进行聚类,针对聚类结果进行疾病预测;步骤十一,对疾病进行智能建议。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周凡,未经周凡许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910240359.9/,转载请声明来源钻瓜专利网。
- 上一篇:体力劳动强度的确定方法、装置及电子设备
- 下一篇:一种医疗数据处理平台