[发明专利]一种基于时空聚类统计进行疾病风险评估的方法有效
申请号: | 201810995255.4 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109065168B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 龙华;杨威;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06F16/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 统计 进行 疾病 风险 评估 方法 | ||
本发明公开了一种基于时空聚类统计进行疾病风险评估的方法,属于时空事件聚类分析方法领域。本发明首先收集疾病数据生成疾病数据库;然后根据数据库中数据,给数据库中每个区域和时间周期内的数据添加辅助数据;再通过时空凝聚式聚类算法和混合泊松对数线性模型进行处理;最后通过决策规则判断风险。本发明与现有技术相比,本发明使用时空凝聚式聚类算法和混合泊松对数线性模型对数据进行处理,并通过决策规则对处理结果进行判断,减少了疾病风险图的过度平滑对估计结果的影响,提高了估计结果的准确性。
技术领域
本发明涉及一种基于时空聚类统计进行疾病风险评估的方法,属于时空事件聚类分析方法领域。
背景技术
在当今社会,各类疾病的检查及其预防中,时空聚类统计方法通常被用作各类疾病爆发的早期风险评估中,许多研究人员通过该方法在海量的数据中挖掘隐藏在数据背后的关联性,通过对于这些数据之间关联性的解读,得到区域单位数据的疾病风险图,该风险图通常是通过具有局部空间平滑的泊松混合模型来估计的,然而,该模型存在的缺陷是,局部不连续点通常不被模拟,热或冷点区域聚类被屏蔽,导致疾病风险图的过度平滑,造成预警准确性的下降。
发明内容
为了克服现有技术的不足,本发明的目的在于一种基于时空聚类统计进行疾病风险评估的方法。本发明是在提升疾病预警时空统计聚类的结果准确率上,主要为提高时空统计聚类结果的准确性,使用时空凝聚式聚类算法以及混合的泊松对数线性模型对疾病数据进行处理从而提升疾病风险评估的准确性。
本发明采用的技术方案是:一种基于时空聚类统计进行疾病风险评估的方法,包括如下步骤:
Step1:收集疾病数据生成疾病数据库;
Step2:获取数据库中数据,并给数据库中每个区域和时间周期内的数据添加辅助数据;
Step3:对Step2中经过处理的数据,使用时空凝聚式聚类算法进行处理;
Step4:对Step3中处理过的数据,利用混合泊松对数线性模型进行分析;
Step5:对Step4中的分析结果利用决策规则判断风险;
Step6:根据Step5中的判别结果对疾病风险进行估计。
进一步地,所述步骤Step2中,添加的辅助数据是来自具有类似时空风险模式的疾病。
进一步地,所述步骤Step3中,时空凝聚式聚类算法的具体实施步骤是:
S1:构造一个初始聚类配置,Ch={Ch(1),...,Ch(nT)},其中h=nT,每个区域时间段Ait是一种单独的时空聚类。
S2:计算h×h矩阵中聚类之间的距离,聚类中至少包含元素Ait和Ajs中的一副元素,Ait和Ajs是空间邻近地区在同一时间(i~j and t=s),或同一地区相邻时间点(i~jand|t-s|=1)的元素;
S3:将两个具有最小距离聚类的时空单元合并,形成一个新的聚类结构Ch-1;
S4:重复进行S2与S3步骤;
S5:当所有的时空单元被合并在一个新的时空聚类中时,算法结束;
进一步地,所述步骤Step4中,混合泊松对数线性模型既有固定聚类效应,也有随机聚类效应,根据给定的时空聚类配置Ck={Ck(1),...,Ck(k)},基于模型选择标准选择最好的聚类结构。
进一步地,所述固定聚类效应为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810995255.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:老年人运动风险评估方法
- 下一篇:一种养老院看护信息系统