[发明专利]一种基于假阴性样本识别的体检辅助决策系统有效
申请号: | 202111175001.6 | 申请日: | 2021-10-09 |
公开(公告)号: | CN113611411B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 李劲松;吴承凯;周天舒;田雨 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/50;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阴性 样本 识别 体检 辅助 决策 系统 | ||
本发明公开了一种基于假阴性样本识别的体检辅助决策系统,该系统包括数据获取模块、数据预处理模块、基础特征分析模块、假阴性样本识别模块、预测模型构建模块和辅助决策模块;本发明通过模拟普遍性的临床诊断流程,分析诊断缺失产生的数据诱因,并对该过程进行建模,更符合临床逻辑,能够更好地对真实世界医疗数据中的假阴性样本进行发现,提高真实世界医疗数据在体检辅助决策模型的构建与临床辅助决策上的应用能力;本发明在建模和临床辅助决策过程中无需使用额外数据,同时将普遍性的临床实际决策过程嵌入到模型的开发逻辑当中,无需针对应用案例引入额外医学知识,具有较强的普适性。
技术领域
本发明属于医疗健康信息技术领域,尤其涉及一种基于假阴性样本识别的体检辅助决策系统。
背景技术
基于真实世界临床数据(以电子病历数据为代表)进行回顾性临床医学研究和临床辅助决策支持已成为当前医学信息学研究中的常见与重要手段。相较前瞻性的临床随机对照试验(RCT),使用回顾性真实世界数据进行信息学建模具有数据体量大、临床场景全、患者分布相似性高等优势,能够更贴近于实际诊疗场景,具有更好的临床应用价值。
体检是发现潜在疾病的重要手段,其中血常规、尿常规等化验指标带有大量的健康状态信息。但当前的体检过程仅能对小部分疾病进行提示性筛查。基于电子病例数据进行回顾性建模,能够极大提升体检数据对未纳入当前体检发现范围的疾病的识别能力,提升单次体检可带来的健康价值。
然而,由于真实世界医疗数据来源复杂,所包含数据的准确性和完备性会受到具体数据录入时诊疗过程的影响。其中,一种典型的数据不完备情形是真实诊断标签中样本的阳性标签缺失(即假阴性样本),会对后续的预测模型建模及临床应用过程产生较大的影响。可能导致阳性标签缺失的原因包括:1)当次就医过程中存在其他不相关但更受录入医生主观关注的指标/疾病;2)就医时挂号科室或就医原因与目标疾病不一致;3)医生录入疾病时存在遗漏等。
由于假阴性样本在真实世界数据中的普遍存在,许多研究已将该问题纳入考虑。其中,与本申请最相近的技术方案为:①阳性-无标签学习(positive and unlabeledlearning, PU学习),该技术方案将数据中未被标记的样本视为可能为阳性也可能为阴性的无标签样本。Jinbo Chen等[1]通过对样本权重进行调整,消除假阴性样本对整体模型的影响。该技术在逻辑回归算法的基础上,将全局阳性样本比例作为一个额外的未知参量,通过最大化包含该全局阳性样本比例与权重矩阵的似然函数,得到该数据集下全局阳性样本比例的最优值,从而对模型预测值进行矫正,获得最终预测结果;②表征学习,如KavishwarB. Wagholikar等[2]和Yoni Halpern等[3]通过手动/半自动构建与目标诊断相关联的编码集,基于编码集对样本的额外关联数据(如文本数据、组学数据等)进行筛选,从而将大概率为阳性样本的无标签样本标记为阳性,降低假阴性样本对建模过程的整体影响。
与技术方案①相似的现有技术通过调整建模过程中的损失函数、样本权重等,对最终模型参数进行修正。该类技术在设定调整参数时,仅将数据集中的假阴性样本假设为阳性样本的一个随机子集,未结合考虑现实医疗场景中导致“患者在目标疾病上实际为阳性但未诊出或诊断未录入”的假阴性样本产生的实际原因。事实上,假阴性样本的分布与随机分布往往有很大出入。对假阴性样本的随机性假设与实际假阴性样本的出现逻辑不一致,会影响实际的临床预测效果。
与技术方案②相似的现有技术通过表征学习补足阳性样本。然而,表征学习的过程往往需要针对特定疾病构建医学知识门槛较高的术语集,不利于技术的普适性使用。同时,该技术方案需要大量额外医疗数据进行配合,以实现对假阴性样本的发现。对于占真实世界数据中大多数的单次来访患者案例,在缺乏足够额外数据的情况下,基于表征学习的方法无法用于解决真实世界医疗数据中的假阴性问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111175001.6/2.html,转载请声明来源钻瓜专利网。