[发明专利]基于时序画像图的再住院预测方法和系统有效
申请号: | 201710647309.3 | 申请日: | 2017-08-01 |
公开(公告)号: | CN107591204B | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 李晖;徐祥朕;郭伟;崔立真 | 申请(专利权)人: | 山东大学 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G16H50/70;G06Q10/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时序 画像 住院 预测 方法 系统 | ||
1.一种计算机设备,用于病人的再住院预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤,包括:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院;
所述步骤1中还根据每个人最后一次诊断前一定间隔内的数据是否出现冠心病来给每位病人一个再住院标签;
所述步骤4包括:
步骤401:使用一定数量的频繁子图作为图基,计算每个病人的频繁子图对应的重构系数;
步骤402:使用蒙特卡洛模拟方法,模拟数万次,计算最优重构系数,构成重构系数向量;
步骤403:基于所述重构系数向量和再住院标签,使用随机森林算法预测病人是否再住院。
2.如权利要求1所述的一种计算机设备,其特征在于,所述步骤1包括:
步骤101:分析病人住院记录、普通门诊记录、慢性病记录和体检记录;
步骤102:提取病人的所有医疗事件,包括:诊断、用药和体检及相应的时间,根据事件发生的时间,将每个病人的医疗事件序列化;
步骤103:根据每个人最后一次诊断前一定间隔内的数据是否出现冠心病来给每位病人一个再住院标签。
3.如权利要求2所述的一种计算机设备,其特征在于,所述步骤102包括:假设一个病人的医疗事件集合为{sn:n=1,2,...,N},其中N是医疗事件序列的数量,每一个事件序列被表示为sn=((xnl,tnl):l=1,2,...,Ln),其中Ln是序列sn的长度,(xnl,tnl)表示在时间tnl能观察到事件xnl,n是医疗事件序列sn的编号,即第n个医疗事件序列,l是一个事件序列中该事件发生的计数。
4.如权利要求3所述的一种计算机设备,其特征在于,所述步骤2包括:
步骤201:每个病人医疗事件的唯一化作为病人时序画像图的顶点,得到顶点集合;
步骤202:计算顶点之间的权重,得到邻接矩阵;
步骤203:根据所述顶点集合和邻接矩阵,为每个病人构建一个时序画像图。
5.如权利要求4所述的一种计算机设备,其特征在于,所述步骤202中,
从顶点i到顶点j的权重计算公式为:其中κ(·)是一个非递增函数;在sn中事件i和j的越接近,权重越高。
6.如权利要求4所述的一种计算机设备,其特征在于,所述步骤3包括:
步骤301:基于步骤203产生的时序画像图,定出频繁1顶点子图和频繁2顶点子图;
步骤302:设置k的初始值为2,也就是从2顶点子图开始挖掘多顶点频繁子图;
步骤303:判断两个k频繁子图能否合并,若能合并判断合并后图的所有连通k子图是否都为频繁k子图;
步骤304:若合并后图的所有连通k子图都为频繁k子图,把合并后图加入k+1顶点频繁子图候选集合,否则舍弃;
步骤305:判断k+1顶点频繁子图候选集合中每个子图是否频繁,若频繁,加入到k+1顶点频繁子图集合;
步骤306:判断k+1顶点频繁子图集合是否为空,若为空跳出挖掘,不为空k=k+1继续挖掘频繁k+2顶点子图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710647309.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多肉植物抗菌杀虫肥料
- 下一篇:一种多肉植物高效利用肥料