[发明专利]一种基于混合模型的药品不良反应遮蔽效应消除方法有效
申请号: | 201810309833.4 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108538396B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 魏建香;张剑吟;倪霏;朱云霞 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 模型 药品 不良反应 遮蔽 效应 消除 方法 | ||
1.一种基于混合模型的药品不良反应遮蔽效应消除方法,其特征在于,包括以下步骤:
步骤1),获取原始ADR数据库,并进行数据处理:其中原始ADR数据库为国家中心的ADR数据;数据的处理包括对原始ADR数据库进行规整以及对关键数据项进行拆分和组合;
步骤2),矩阵生成:利用数据库编程软件生成用于lasso logistic回归分析的0-1矩阵,该矩阵包括以药品为特征的自变量矩阵X和对应于不良反应的响应矩阵Y;
步骤3),初步筛选:使用lasso logistic回归模型对自变量矩阵X和响应矩阵Y进行分析,得到回归系数βj大于0的系数项所对应的药品-不良反应组合作为首轮筛选后的数据集;
步骤3.1),Lasso logistic回归模型构造为:
对于每种不良反应k,均构建一个lasso logistic回归模型,共构建s个lassologistic回归模型;其中,在第k个模型中,N为经过步骤1)处理后的数据库中报告的总数量,p是经过数据拆分后的数据库中药品的种类,βj为药物j和不良反应k的关联系数,β0为截距;xij为自变量矩阵X中位于第i行第j列的项,即第j个药物是否存在于第i份报告中;yi为响应矩阵Y中的第k列的第i行,即第k个不良反应在第i份报告中是否出现;为平方损失函数,λ为预设的收缩正则化参数,λ通过交叉验证可以确定;用以控制lasso logistic回归模型的复杂度;
步骤3.2),数据集初步筛选;使用MATLAB工具对s个lasso logistic回归模型求解得到相应的系数βj,得到βj大于0的系数项所对应的药品不良反应组合集合,并以该集合做为首轮筛选后的数据集,完成数据库的初步筛选任务;
步骤4),二次筛选:使用移除报告法将首轮筛选后的数据集中小于等于4例报告的组合剔除,余下的组合构成二次筛选后的新数据集;
步骤5),数据的信号检测:通过IC信号检测方法对新数据集重新进行信号检测,即得到最终的信号集,完成混合模型消除遮蔽效应的任务。
2.根据权利要求1所述的基于混合模型的药品不良反应遮蔽效应消除方法,其特征在于,所述步骤1)的详细步骤如下:
步骤1.1),获取原始ADR数据库,原始ADR数据从国家药品不良反应监测中心获得;
步骤1.2),数据处理;
步骤1.2.1),针对原始数据存在缺项、重复、药品名称以及不良反应名称不规范问题,先将数据中的缺项进行删除,重复项做唯一化处理,将不规范的名称重新规范化;
步骤1.2.2),原始数据中会存在一份不良反应病例报告中有n个怀疑药物和m种不良事件,因而需将数据拆分成n*m个药品-不良反应组合,以提高对数据的利用率。
3.根据权利要求1所述的基于混合模型的药品不良反应遮蔽效应消除方法,其特征在于,所述步骤2)的详细步骤如下:
步骤2.1),构造自变量矩阵X;
其中,xij为自变量矩阵X中位于第i行第j列的项,i=1,2,……N;j=1,2,……p;即X为N*p的矩阵;N为经过步骤1)处理后的数据库中报告的总数量;p是经过数据拆分后的数据库中药品的种类;xij表示第i份报告中是否包含第j种药品,如若包含则xij置为1,否则置为0;
步骤2.2),构造响应矩阵Y;
其中,yru为自变量矩阵Y中位于第r行第u列的项,r=1,2,……N;u=1,2,……s;N与步骤2.1)中的N值相同;s是经过数据拆分后的数据库中不良反应的种类;yru表示第r份报告中是否报导第u种不良反应,如若报导则yru置为1,否则置为0;其中自变量矩阵X与响应矩阵Y的同一行对应同一份报告。
4.根据权利要求1所述的基于混合模型的药品不良反应遮蔽效应消除方法,其特征在于,所述步骤5)的详细步骤如下:
在新的数据集的基础上,使用IC算法进行信号检测,IC算法如下:
令ci=A,cj=A+B,ck=A+C,N=A+B+C+D,φ=1,α=β=1,δ=η=2,则有
γ=φ(N+δ)(N+η)/[(cj+α)(ck+β)]
E(IC)=log2[(ci+φ)(N+δ)(N+η)/((N+γ)(cj+α)(ck+β))]=log2γ(ci+φ)/(N+γ)
V(IC)={(N-ci+γ-φ)/[(ci+φ)(1+N+γ)]+(N-cj+δ-α)/[(cj+α)(1+N+δ)]+(N-ck+η-β)/[(cj+β)(1+N+η)]}/(log2)2
其中IC=E(IC),SD=V(IC),IC值的下限为IC-2SD,上限为IC+2SD;信号检测评价标准为IC-2SD0,则产生信号;
其中的A、B、C和D表示如下:A为目标药物引起目标ADR数量,B为目标药物引起其他ADR数量,则A+B表示目标药物引起的ADR总数;C为其他药物引起目标ADR的数量,D为其他药物引起其他ADR的数量,则C+D表示其他药物引起ADR的总数,A+B+C+D表示所有药品引起所有ADR的总量;将A、B、C、D的值代入IC算法中计算出IC值、SD值,得到最终的信号集,完成混合模型消除遮蔽效应的任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810309833.4/1.html,转载请声明来源钻瓜专利网。