[发明专利]一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测方法及系统在审
申请号: | 202010267024.9 | 申请日: | 2020-04-03 |
公开(公告)号: | CN113496782A | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 梁循;赵晓磊;薛扬;丁戌倩;马跃峰;张海燕;阮进;刘洋 | 申请(专利权)人: | 梁循 |
主分类号: | G16H50/80 | 分类号: | G16H50/80;G06F16/29;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100872 北京市海淀区中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 位置 阶段 逐次 减小 流行病 确诊 患者 密切 接触 人员 检测 方法 系统 | ||
1.一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测方法,其特征在于,包括以下内容:
1)从某地图软件中采集用户在某城市一天内的位置数据,对8时到22时的用户位置数据进行切片,每隔T小时切片一次,共设14/T+1个时间切片(时间快照)。切片的数目并非固定,可以根据不同城市的具体要求,每天选取的时间切片个数可以有相应的差异,例如,对于疫情较为严重的城市,可以采用每半小时切片一次,每天共设置30个时间切片,疫情较轻的城市可每1小时切片一次,每天共设15个切片;
2)对每一个时间切片进行聚类。每一个用户为1个样本点,样本点分为三类,分别为:特征值为1的确诊感染者;特征值为0的未风险未知者;特征值为-1的排除风险者。类也分为三种,分别为:特征值为1的存在风险类;特征值为0的风险未知类;特征值为-1的排除风险类。在每次聚类只给定一个初始特征值为1的样本点;
3)使用本发明提出的残K-means方法进行聚类。首先,根据城市的区域划分或地域特点,给定一个初始类别数目K值,按照K-means方法对所有的样本点进行聚类,在聚类开始时,全部类别初始特征值为0,即无法排除风险。在聚类过程中,对于特征值为1的确诊感染者,若其在多次迭代过程中,从未出现在某一类中,则可认为在该置信度下,这一类的特征可改写为-1,在后续的计算中可忽略此类。对于特征值为-1的未患病人员,若在多次迭代过程中,持续被划分在排除风险的类别中,则可认为在该置信度下该样本的特征值可标为-1,在后续过程中可忽略这些样本,利用这种方法,可以持续缩减需要参与到计算中来的数据量,从而可以实现在计算速度上的极大提高;
4)持续对剩余的样本点进行残K-means聚类。在迭代过程中,排除风险的类别和样本在计算中被逐渐忽略,对无法排除风险的类别不断进行聚类,当聚类结果保持不变时,迭代结束,完成聚类,在聚类中剩余的样本点均无法排除与确诊患者密切接触的风险。此时,初始存在的节点有一大部分都已经被舍弃,也正是因为不断舍弃排除风险节点,才使得本发明提出残K-means算法可以完成聚类要求。对于各时间片内的密切接触者,可基于频次叠加确定其感染概率。
2.如权利要求1所述的一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测方法,其特征在于,所述步骤1)中,对8时到22时的用户位置数据进行切片,其中,在每一个时间切片中,对于一个用户m,其位置可以用位置函数l(m)进行表示。
3.如权利要求1所述的一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测方法,其特征在于,所述步骤3)中,使用本发明提出的残K-means方法进行聚类,在聚类过程中,对于样本点m,需要计算其到每一个类的距离,并将该样本点划分到距离其最近的一个类中。样本点m到类n的距离可以表示为d=l(m)-l(c_n),其中,c表示类n的中心。
4.如权利要求1所述的一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测方法,其特征在于,所述步骤3)中,使用本发明提出的残K-means方法进行聚类,在每次迭代结束后,需要为在此次迭代中有变化的类更新类的中心位置,类的中心采用均值方法进行计算。例如,对于点A(x1,y1)、B(x2,y2)和C(x2,y2),中心可以表示为(x1+x2+x3)/3和(y1+y2+y3)/3。
5.如权利要求1所述的一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测方法,其特征在于,所述步骤3)中,在聚类过程中,对于特征值为1的确诊感染者,若其在多次迭代过程中,从未出现在某一类中,则可认为在该置信度下,这一类的特征可改写为-1,在后续的计算中可忽略此类。对于特征值为-1的未患病人员,若在多次迭代过程中,持续被划分在排除风险的类别中,则可认为在该置信度下该样本的特征值可标为-1,在后续过程中可忽略这些样本。其中,迭代次数越多,则可排除此类或此样本点的置信度越高,迭代次数越少,则可排除此类的置信度越低。
6.一种基于位置的多阶段逐次减小的流行病确诊患者密切接触人员检测系统,其特征在于,包括:
用户位置数据切片模块,用于从某地图软件中采集用户在某城市一天内的位置数据,并对8时到22时的用户位置数据进行切片,其中每隔T小时切片一次,共设14/T+1个时间切片;
地理位置信息聚类模块,用于根据每一时间切片中的用户位置数据进行本发明提出的多阶段逐次减小的残K-means聚类,通过在聚类过程中不断忽略已经排除感染风险的类别和样本,进而大大减少了聚类运算的时间复杂度,使得在疫情期间的利用大规模聚类算法寻找密切接触人员成为可能;
感染概率判别模块,对于每一个时间切片,地理位置信息聚类模块会给出该时间切片下存在感染风险的样本,该模块根据上述数据样本,进行叠加,基于频次给出相应的感染概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梁循,未经梁循许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010267024.9/1.html,转载请声明来源钻瓜专利网。