[发明专利]一种基于医保大数据测算罕见病发病率的分析方法有效
申请号: | 201811045882.8 | 申请日: | 2018-09-07 |
公开(公告)号: | CN109448846B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 詹思延;王胜锋;冯菁楠;许璐;高培;王金喜;尉晨 | 申请(专利权)人: | 北京大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06Q40/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于医保大数据测算罕见病发病率的方法,涉及医保数据处理与分析技术,所测算疾病为不能彻底治愈,一旦诊断,终生罹患。通过汇总每月医保数据的多个关键参数,得到发病率计算所需分子与分母信息,进而计算得到发病率;所需分子为特定时间内一定范围人群中目标疾病的新发生病例数;所需分母为特定时间内的暴露人口数,即可能发生目标疾病的人,且需排除已患病在特定时间内不可能再成为新发病例的人。通过本发明方法能够获得罕见病的发病率资料,促进罕见病流行病学研究的开展,为合理制定临床指南提供数据和技术支持;进一步促进医保大数据的转化应用,填补我国罕见病流行病学资料的空白。 | ||
搜索关键词: | 一种 基于 医保 数据 测算 罕见 发病率 分析 方法 | ||
【主权项】:
1.一种基于医保大数据测算罕见病发病率的分析方法,其特征是,所测算疾病为不能彻底治愈,一旦诊断,终生罹患;基于医保数据库,通过汇总每月医保数据的多个关键参数,得到发病率计算所需的分子与分母信息,进而计算得到发病率;多个关键参数包括:每月参保个体总数、每月新增参保个体数、每月就诊记录总数、每月就诊记录诊断缺失总数、一定时期内的新发病例数、一定时期内已患病人数;发病率计算所需的分子为特定时间内一定范围的人群中目标疾病的新发生病例数;发病率计算所需的分母为特定时间内的暴露人口数,即可能发生目标疾病的人,且需排除已患病在特定时间内不可能再成为新发病例的人;包括如下步骤:A1.确定医保数据库范围,包括:时间跨度、地域分布、门诊/住院;A2.数据库的基本清洗,定义目标疾病并构建目标疾病字典库;数据库的基本清洗包括:A21)核查数据库中变量的完整性和逻辑性;A22)数据库中文本内容的编码标准化和自然语言处理;A23)确定和统一数据库中的国际疾病分类ICD编码的版本;目标疾病的定义以医保数据库中出现对应疾病的名称或ICD编码为准,包括文本数据和ICD编码的多种形式;并通过分词技术构建包含目标疾病诊断名称表达的字典库;A3.汇总分母信息;具体分为四组:分母信息第一组:参保但从未报销的个体;分母信息第二组:参保且有报销记录但未出现目标疾病诊断的个体;分母信息第三组:参保有报销记录且出现目标疾病诊断的个体;分母信息第四组:一定时间内已患目标疾病的个体;根据每位个体在每个月的参保状态,若有参保记录则纳入参保人次,否则为未参保人次,进行剔除;分母信息第一组具体通过式1按人月总和对应计算得到:
其中,t表示第t个月份;Insurancet,n为第n个该组个体在第t个月份的参保状态;N代表分母的第一组的人月总和;分母信息第二组包括三种情况;分母信息第二组第一种情况:未因病就诊无报销记录的人月直接纳入分母,对每月而言,即未因病就诊无报销记录的当月人数m1,1;分母信息第二组第二种情况:因病就诊且诊断完整的人月应纳入分母计算,对每月而言,即因病就诊且诊断完整的当月人数m1,2;分母信息第二组第三种情况:有就诊但诊断缺失的人月应考虑后续填补,提取因病就诊但诊断缺失的当月人数m1,3。分母信息第二组具体通过式2按人月总和计算得到:
其中,t表示第t个月份;Insurancet,m为第m个该组个体在第t个月份的参保状态;M代表第二组分母的人月总和;分母信息第三组包括三种情况;分母信息第三组第一种情况:未因病就诊无报销记录的人月直接纳入分母,对每月而言,即未因病就诊无报销记录的当月人数k1,1;分母信息第三组第二种情况:因病就诊且诊断完整的人月应纳入分母计算,对每月而言,即因病就诊且诊断完整的当月人数k1,2;分母信息第三组第三种情况:有就诊但诊断缺失的人月应考虑后续填补,对每月而言,即因病就诊但诊断缺失的当月人数k1,3;分母信息第三组具体通过式3按人月总和计算得到:
其中,t表示第t个月份;Insurancet,k为第k个该组个体在第t个月份的参保状态;K代表示第三组分母的人月总和;分母信息第四组通过式4计算得到已患病的个体的总和:
其中,t1表示一定时期内;P代表该时期内的已患病人数总和;A4.汇总分子信息,包括两组:新发患者和需填补测算的新发患者;新发患者是一定期间内一定范围人群中目标疾病的新发生病例数;新发患者的计算方法是:根据疾病的不同选用不同的洗脱期,在计算发病率的特定时间之前没有出现目标诊断的患者,将一定时期t1内的全部新发患者记为
需填补测算的新发患者测算基于就诊信息的诊断缺失与是否罹患某种罕见病的关联不存在统计学意义,记为∑tCase;A5.对分子信息中的新发患者的基本特征进行核查与统一,使得不同来源的数据信息一致;A6.计算发病率:将汇总的分子信息与分母信息求商,计算得到发病率。通过上述步骤,实现基于医保大数据测算疾病发病率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811045882.8/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置