[发明专利]一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法在审
申请号: | 201710969307.6 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107767954A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 李连发;方颖;王劲峰 | 申请(专利权)人: | 中国科学院地理科学与资源研究所 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06K9/62;G06N7/00 |
代理公司: | 北京科迪生专利代理有限责任公司11251 | 代理人: | 安丽 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空间 贝叶斯 网络 环境 健康 风险 监测 预警系统 方法 | ||
1.一种基于空间贝叶斯网络的环境健康风险监测预警系统,其特征在于:包括域知识确定变量及变量域模块、数据离散化模块、空间局聚集性识别模块、空间自相关识别模块、网络结构建立模块、网络结构微调及估计参数模块、空间推理建立模块、疾病风险概率预测值模块和预警应用模块;其中:
域知识确定解释变量及变量域模块:根据领域知识识别疾病的传播介质及识别疾病的影响因素作为解释变量,将发病率数据作为目标变量;所述疾病的传播介质有土地、水、空气和交通四种,将所述四个传播介质量化到具体的解释变量,所述解释变量分别为土地覆盖、NDVI、PM2.5和交通路网;所述疾病的影响因素分为气象状况和社会经济因素,所述气象状况包括温度、湿度、气压和风速,社会经济因素包括GDP、在校学生比例和人均床位数;
数据离散化模块:对域知识确定解释变量及变量域模块得到的目标变量及解释变量,进行离散化处理,即将这些解释变量和目标变量进行离散化处理,划分为若干个等级;对解释变量的离散化方法采用Fayyad and Irani的算法选择对目标变量分类最优的离散化区间;最后得到离散化的目标变量和解释变量,送至网络结构建立模块;
空间聚集性识别模块:采用空间扫描统计的方法,对所采集的发病数据进行聚集分析,发现疾病聚集性暴发的区域,通过最大似然及统计假设检验获得疾病空间聚集的结果,识别疾病的高及低风险聚集区;最后得到疾病的高及低风险聚集区,然后送至空间推理建立模块;
空间自相关识别模块:根据已有的发病率数据,识别空间自相关效应,更全面地刻画手足口病发病的时空模式;识别空间自相关效应采用GeoDa计算局域空间自相关指数LISA,得到局域空间自相关指数,然后送至空间推理建立模块;
网络结构建立模块:根据数据离散化模块得到的离散化的目标变量和解释变量,建立初步的网络结构,方法通过解释变量和目标变量数据采用爬山、模拟退火及遗传算法学习建立初步的网络结构;最后得到一个初步的网络结构,然后送至网络结构建立微调及估计参数模块;
网络结构建立微调及估计参数模块:根据网络结构建立模块得到的网络结构,通过域知识微调网络结构及估计参数,得到网络结构;提取网络结构中的共同的连接,再结合气象及环境影响因素对疾病影响的域知识对所述网络结构调优;在网络结构调优的基础上,通过概率统计、EM或Gibbs抽样计算连接参数,最后得到符合要求的网络结构,然后送至空间推理建立模块;
空间推理建立模块:根据网络结构建立微调及估计参数模块得到的网络结构、空间聚集性识别模块得到的高及低风险聚集区和空间相关性识别模块得到的局域空间自相关指数,建立空间推理功能;在网络结构建立微调及估计参数模块得到的网络结构的基础上,加入空间聚集性和空间自相关性,进行空间推理,建立空间推理模型,将得到的空间推理模型,然后送至疾病风险概率预测值模块;
疾病风险概率预测值模块:根据空间推理建立模块得到的空间推理模型,计算疾病风险概率预测值;在空间贝叶斯网络建立的基础上,通过贝叶斯网络的后验概率推导得到疾病风险概率预测值,将得到病风险概率预测值送至预警应用模块;
预警应用模块:根据疾病风险概率预测值模块得到的疾病风险预测值,预警疾病;利用疾病风险概率预测值来预警疾病的发生,得到疾病发生的风险,最终将疾病发生的风险应用到实际疾病预警中去。
2.一种基于空间贝叶斯网络的环境健康风险监测预警方法,其特征在于:包括以下步骤:
(1)确定解释变量及变量域步骤:根据领域知识识别疾病的传播介质及识别疾病的影响因素作为解释变量,将发病率数据作为目标变量;所述疾病的传播介质有土地、水、空气和交通四种,将所述四个传播介质量化到具体的解释变量,所述解释变量分别为土地覆盖、NDVI、PM2.5和交通路网;所述疾病的影响因素分为气象状况和社会经济因素,所述气象状况包括温度、湿度、气压和风速,社会经济因素包括GDP、在校学生比例和人均床位数;
(2)数据离散化:对步骤(1)中的解释变量进行离散化处理,对目标变量进行离散化处理,并根据其对疾病发病风险贡献率的大小进行变量的选择,减少风险评估模型中的噪音,根据最优的离散化方案,计算解释变量的对目标变量分类的贡献度,采用Quinlan信息获取比率作为划分的依据;
(3)计算区域的空间聚集性:经过了数据离散化处理之后,利用空间扫描统计对已获取的目标变量,即发病率数据,计算区域的空间聚集性;
(4)计算局域空间自相关LISA:对已获取到的目标变量即发病率数据,采用GeoDa计算局域空间自相关LISA,LISA代表局部空间自相关指数local index of spatial association,可以用来判定局部空间相关性;
(5)建立初步的网络结构,根据数据离散化步骤中得到的离散化的解释变量和目标变量,采用爬山或模拟退火及遗传算法建立初步的网络结构,在此基础上提取共同点连接;
(6)根据第(5)步中学习得到的网络结构,提取网络结构中共同的连接,再结合气象及环境因素对疾病影响的域知识对网络结构调优,包括移除不合域知识的概率依赖连接,增加合理的连接,通过人工干预使得建立的网络模型更符合机理,在网络结构调优的基础上,通过概率统计、EM或Gibbs抽样计算连接参数,即得到条件概率表,从而完成网络模型的建立;
(7)在第(6)步骤中构建的网络模型的基础上,建立空间推理功能,发病率数据样本点数不是很大的情况下,所述不是很大视情况而定,指30以下,直接进行统计计算:对空间聚集性和空间相关性,通过概率依赖关系建立条件概率依赖关系:
其中,p表示概率,r表示发病率,r1表示发病率“高”的风险水平,r0表示发病率“低”的风险水平;c表示是否"热点",ck=1代表热点,LISA>=threshold代表“高相关性”,ck=0代表非聚集区,LISA<threshold代表“低相关性”;如果发病率数据有缺失,采用EM算法对数据进行缺失的修复;
(8)在第(7)步骤中的空间推理功能建立中上,通过贝叶斯网络的后验概率得到疾病风险概率预测值;
(9)利用步骤(8)中得到的疾病风险率预测值,根据风险率预测值的大小,进行疾病预警的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院地理科学与资源研究所,未经中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710969307.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:级进模双动式侧推冲孔机构
- 下一篇:一种不锈钢蒸锅的蒸盘冲孔节能模具