[发明专利]一种基于滑动窗口时序模型的虫媒疾病预测方法及系统有效
申请号: | 202010240755.4 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111462919B | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 王鑫;唐烨榕;张凤军;周红宁;杜龙飞;梁赓;丁海元 | 申请(专利权)人: | 中国科学院软件研究所;云南省寄生虫病防治所 |
主分类号: | G16H50/80 | 分类号: | G16H50/80 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 邓治平 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 滑动 窗口 时序 模型 疾病 预测 方法 系统 | ||
1.一种基于滑动窗口时序模型的虫媒疾病预测方法,其特征在于,包括以下步骤:
步骤一,收集虫媒疾病病例信息,形成原始数据序列;
步骤二,
对原始数据序列进行分段,形成训练数据序列,建立时间序列模型,形成模型库;所述步骤二中,所述训练数据序列是用滑动窗口方法对原始数据序列进行分段计算得到,包括如下过程:设置滑动窗口宽度上限和下限,选取起始位置和滑动窗口宽度,从起始位置开始向后移动窗口,每次移动步长为一个滑动窗口宽度,对每个滑动窗口宽度内的发病人数求和;通过选取起始位置和滑动窗口宽度,对应产生一条训练数据序列,由此一条训练数据序列训练产生一个时间序列模型;当滑动窗口移动到原始数据序列末段,剩余天数不足一个滑动窗口宽度时,该末段 区间数据不进行处理;通过选取不同的起始位置和窗口宽度,训练产生若干时间序列模型,形成模型库;
所述步骤二中,所述时间序列模型建立方法包括如下过程:
设置差分阶数阈值、自回归阶数阈值和移动平均阶数阈值,针对每条训练数据序列,利用Augmented Dickey-Fuller Test检验其平稳性,若序列不平稳,则进行差分使其变为平稳序列;基于平稳序列,选取自回归阶数和移动平均阶数,建立时间序列模型,对结果残差进行Ljung-Box检验,计算时间序列模型的赤池信息量,仅保留赤池信息量最小且结果残差属于白噪声的时间序列模型,同时得到该时间序列模型在不同窗口的预测值;
步骤三,基于滑动窗口机制和目标窗口区间的需求,对应选取时间序列模型,计算目标窗口区间的病例数;所述步骤三中,选取目标窗口区间的起始位置和窗口宽度,基于应包含此目标窗口区间的相关模型的预测值,计算目标窗口区间病例数,包括如下过程:
选取目标窗口区间的起始位置和窗口宽度,目标窗口宽度应小于各模型的滑动窗口宽度,同时选取包含此目标窗口区间的若干模型组合,每个模型组合包含两个时间序列模型,且这两个时间序列模型的滑动窗口之差为目标窗口,基于每个模型组合的预测值及每个模型组合的权值,计算目标窗口区间的预测值;步骤四,利用热点图的表现形式,实现模型预测结果的动态可视化呈现。
2.根据权利要求1所述的一种基于滑动窗口时序模型的虫媒疾病预测方法,其特征在于:
所述步骤一中,所述虫媒疾病病例信息是指虫媒疾病病例的现居住地址、发病日期和病例个数,依据现居住地址和发病日期对病例个数进行分类汇总,统计相关地区每日发病人数,未出现病例则用零填充,按时间先后顺序对统计结果进行排序,形成原始数据序列。
3.根据权利要求1所述的一种基于滑动窗口时序模型的虫媒疾病预测方法,其特征在于:
所述步骤四中,利用随时间变化的热点图的表现形式,实现模型预测结果的动态可视化呈现,所述呈现的方法包括基于地理区域的空间聚合热点图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所;云南省寄生虫病防治所,未经中国科学院软件研究所;云南省寄生虫病防治所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010240755.4/1.html,转载请声明来源钻瓜专利网。