[发明专利]基于决策树分层的药品不良反应数据遮蔽效应消除的方法有效
申请号: | 202010841630.7 | 申请日: | 2020-08-20 |
公开(公告)号: | CN112133450B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 魏建香;阮倩昀;卢志强 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G16H10/40 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 牛莉莉 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 分层 药品 不良反应 数据 遮蔽 效应 消除 方法 | ||
本发明公开了一种基于决策树分层的药品不良反应数据遮蔽效应消除的方法,所述方法以中国药品不良反应即ADR报告数据为基础,研究基于决策树分层的药品不良反应数据遮蔽效应消除的问题,设计了基于标准库的评价指标并构建了实现多级分层的决策树,以MHRA信号检测方法来比较分层前后数据集信号检测的差异性,最终给出了实现削减药品不良反应数据遮蔽效应的基于决策树的多级分层策略。本发明为中国药品不良反应报告进行信号检测中数据遮蔽效应的消除提供了一种可参考方法。
技术领域
本发明属于信号检测领域,具体涉及一种用于我国的基于决策树分层的药品不良反应数据遮蔽效应消除的方法。
背景技术
目前的自发呈报数据库中ADR数量庞大、种类多样,信号检测易受到混杂因子的影响,从而导致一些重要的信号被遮蔽,这将影响信号检测的准确性。有关药品-不良反应报告的分层研究表明,与直接对未分层的数据做信号检测相比,分层将揭示出药品与不良反应事件之间新的关联关系,有利于减弱混杂因子遮蔽信号的影响。
此外,现有的分层研究是将混杂因子对信号检测的影响进行了独立地研究,而在自发呈报数据库数量庞大、种类多样的背景下,多个混杂因子会对信号检测有不同程度的影响,因此在分层的过程中综合考虑多个混杂因子,有利于发现药品和不良反应之间新的关联关系。
发明内容
解决的技术问题:本发明在分层的过程中综合考虑多个混杂因子,提出一种基于决策树分层的药品不良反应数据遮蔽效应消除的方法。该方法是指采用构造决策树的流程,将药品不良反应数据集按照三个混杂因子进行多级分层,并对分层后的数据子集做信号检测处理,将此结果与分层前的信号检测结果作比较,从而分析基于决策树的多级分层方法削弱数据遮蔽效应的能力。
技术方案:一种基于决策树分层的药品不良反应数据遮蔽效应消除的方法,所述方法包括以下步骤:
1)数据的采集:数据的采集包括原始ADR数据的采集和标准库的采集;
2)数据的预处理:数据的预处理包括对所述原始ADR数据中的不良反应名称规范为标准库中包括的不良反应名称,删除标准库中未包括的药品及其所述未包括药品的不良反应数据,统一化混杂因子所在的字段值,添加药品不良反应是否出现在标准库的字段“是否已知”,记录重复的药品不良反应组合数;
3)构建多级分层的决策树:将原始ADR数据的四个特征“性别”、“年龄”、“是否属于抗生素类”和“地区”视为混杂因子。由于待研究的混杂因子过多时,分层会过细,对信号检测效能产生负面影响。而混杂因子数量过少使得无法有效地均衡不同特征数据之间的差异,因此确定待研究的混杂因子个数为3。为了确定主要的三个混杂因子,从上述四个混杂因子中任选三个作为数据的特征,进行下述构建决策树的过程。将“是否已知”字段作为决策任务的类标签,利用WEKA软件中的J48分类算法构建决策树,根据每一个子类中数据实际的类别和预测的类别不一致的比例,来分析分类的精度。再次选择三个不同的混杂因子,重复构建多级分层的决策树的步骤。最后,选择分类精度最高的一组混杂因子;
4)信号检测:从所构建的决策树中得到分类的规则,即将ADR数据按照三个混杂因子的优先顺序分类,根据分类的规则从数据集中提取出每一个子类中的数据,即数据子集,采用信号检测方法分别对数据集和数据子集进行信号检测,从而获得两个信号集,总样本的信号检测结果对应信号集1,子样本各自做信号检测后整合的结果对应信号集2;
5)性能评估:以标准库作为检验的标准,设计评价指标,对两个信号集进行性能评估,分析基于决策树的多级分层方法在削弱数据遮蔽效应方面发挥的作用。
501)设计基于标准库的四格表
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010841630.7/2.html,转载请声明来源钻瓜专利网。