[发明专利]疾病异常数据检测方法及装置、计算机装置及存储介质在审
申请号: | 201810321852.9 | 申请日: | 2018-04-11 |
公开(公告)号: | CN108597616A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 阮晓雯;徐亮;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16H50/80 | 分类号: | G16H50/80 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 杨毅玲;何玲君 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间点 疾病监测 异常数据检测 时间窗 时间序列数据 计算机装置 标准差 疾病 可读存储介质 存储介质 数据异常 检测 | ||
一种疾病异常数据检测方法,所述方法包括:获取时间点0到时间点t的疾病监测数据,构成时间序列数据;选取时间窗大小w,针对时间点w至时间点t中的每个时间点i,计算所述时间点i对应的时间窗内疾病监测数据的均值和标准差;根据每个时间点i对应的时间窗内疾病监测数据的均值和标准差,计算所述时间点i对应的疾病监测数据的moving‑zscore值,得到mz列表;根据所述mz列表确定所述时间序列数据的异常值阈值;若时间点i对应的疾病监测数据的moving‑zscore值大于所述异常值阈值,则所述时间点i对应的疾病监测数据为异常值。本发明还提供一种疾病异常数据检测装置、计算机装置及可读存储介质。本发明可以实现高效准确的疾病监测数据异常检测。
技术领域
本发明涉及数据处理技术领域,具体涉及一种疾病异常数据检测方法及装置、计算机装置和计算机可读存储介质。
背景技术
随着全球经济一体化进程的加快,经济与交流活动增加,人群流动日益频繁,为疾病的传播与爆发提供了有利环境,公共卫生健康问题越来越严峻。同时,社会与自然环境也发生着变化,环境污染、自然灾害等影响公众健康事件的增多也增加了突发公共卫生事件爆发的可能性。
如何检测出疾病异常数据,以便能够早期识别到疾病流行或爆发的突发公共卫生事件,尽早采取相应的控制措施,将突发公共卫生事件造成的损失降到最低,成为亟待解决的问题。
现有的异常检测方法,例如zscore异常检测方法、格拉布斯(Grubbs)异常检测方法都要求数据满足正态分布,而实际上很多时候无法满足这个要求。对于传统的四分位法,会用到所有的数据,而过去久远的数据对当前数据的参考价值低,结果更容易出现偏差。
发明内容
鉴于以上内容,有必要提出一种疾病异常数据检测方法及装置、计算机装置和计算机可读存储介质,其可以实现高效准确的疾病监测数据异常检测。
本申请的第一方面提供一种疾病异常数据检测方法,所述方法包括:
获取时间点0到时间点t的疾病监测数据,构成时间序列数据X,X=[x0,x1,x2,…,xt];
选取时间窗大小w,针对时间点w至时间点t中的每个时间点i,计算所述时间点i对应的时间窗内疾病监测数据的均值μi和标准差σi,所述时间点i对应的时间窗的大小为w,i=w,w+1,…,t;
根据每个时间点i对应的时间窗内疾病监测数据的均值μi和标准差σi,计算所述时间点i对应的疾病监测数据xi的moving-zscore值mzi,得到mz列表 [mzw,mzw+1,mzw+2,…,mzt],其中
根据所述mz列表确定所述时间序列数据X的异常值阈值;
判断时间点i对应的疾病监测数据xi的moving-zscore值是否大于所述异常值阈值,若时间点i对应的疾病监测数据xi的moving-zscore值大于所述异常值阈值,则所述时间点i对应的疾病监测数据xi为异常值。
另一种可能的实现方式中,所述根据所述mz列表确定所述时间序列数据 X的异常值阈值包括:
计算所述mz列表的预设分位数或预设百分位数,将所述预设分位数或预设百分位数作为所述异常值阈值;或者
计算所述mz列表的平均数,将所述平均数作为所述异常值阈值。
另一种可能的实现方式中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810321852.9/2.html,转载请声明来源钻瓜专利网。