[发明专利]一种基于迁移学习的疾病领域间病人相似性度量迁移系统有效
申请号: | 201710136858.4 | 申请日: | 2017-03-09 |
公开(公告)号: | CN106934235B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 刘杰;倪嘉志;马志柔;吴怀林;叶丹 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/20 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;顾炜 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 疾病 领域 病人 相似性 度量 系统 | ||
本发明一种基于迁移学习的疾病领域间病人相似性度量迁移系统,属于计算机人工智能软件技术领域。本发明系统通过构建数据预处理子模块、相似性度量评价子模块、相似性度量学习子模块、相似性度量迁移子模块四个子模块,完成疾病领域内病人相似性的度量和疾病领域间病人相似性的迁移。本发明目的在于克服在监督信息获取困难和特定疾病领域病人样本数量稀少的情况下传统度量学习无法有效工作的问题。此系统可以为当前精准医疗场景提供服务支持。
技术领域
本发明涉及一种基于迁移学习的疾病领域间病人相似性度量系统,属于计算机人工智能软件技术领域。
背景技术
随着医疗卫生服务的信息化进程推进,医院、体检中心等大型医疗机构产生了大量的医疗电子健康记录。数据内容主要来自医院的电子病历、区域卫生信息平台采集的居民健康档案等,包含大量非结构化/半结构化的数据。如何通过病人门诊、住院、用药及健康等相关数据给出具有临床意义的病人间相似度度量,是在临床决策支持和病人群体识别研究中的一个重要任务。基于病人相似度的案例查询可以成为医生的技术补充,医生根据此项技术可以对病人进行初步诊断,病人相似度还可以应用在病人群体识别及病人风险分级等诸多领域。
如何获得合适的病人相似度成了病人相似性度量系统的关键性问题,较早期的病人相似性度量系统是利用已知的度量公式来直接对系统中的病人向量进行相似性度量,例如使用欧氏距离、余弦相似度、皮尔逊相关系数等方法在向量上直接运算。采用这种方式的病人相似性度量系统因为不需要训练过程,在处理速度上相对于采用度量学习方法的系统会有很大程度的提高;但在计算准确度上也相应的会有一定的差距。
相对于上述利用公式直接计算的病人相似性度量系统,目前在医疗领域应用比较广泛的是利用度量学习的病人相似性度量系统,系统中将病人相似度问题转化成有监督的距离度量学习问题,从而合理利用医疗专家的反馈信息。Wang Fei等人提出了基于局部监督信息的病人相似度学习LSML算法(参见文献:J.Sun,F.Wang,J.Hu,Supervised patientsimilarity measure of heterogeneous patient records,ACM SIGKDD,2012,16–24),该算法利用医疗专家对病人所打的标签作为监督信息,通过比较标签是否相等,来识别出以某个病人为中心的一定范围内的同构邻居和异构邻居,再通过拉近(pull)同构邻居,推远(push)异构邻居来学习出一种泛化的Mahalanobis距离。从局部进行计算的LSML算法是目前病人相似性度量领域准确率最高的算法,IBM Watson研究院也基于此算法开发出了一套基于病人相似性度量的辅助诊疗检索系统,通过查询相似病人,方便医生根据相似的病人进行诊断。
由于深度学习技术日趋成熟,各领域开始利用深度学习来试图取得更好的效果。目前在医疗领域,利用深度度量学习方法的病人相似性度量系统也取得了更高的准确率。相比于传统的度量学习,在利用深度度量学习的系统中病人向量不再被直接使用,而是利用自动编码机或卷积神经网络对向量进行进一步低维度处理,再在低维度空间中优化系统定义的损失函数,最终将得到的病人相似度提供给医生使用。当然,基于深度度量学习的系统在取得高准确度的同时,它的计算成本也会大大提高,所以系统对应的计算速度较前两类系统有着一定的差距。
上述三类的病人相似性度量系统可以在特定疾病领域中取得不错的效果,根据实际医疗需求在计算速度和准确度两方面来进行选择合适的系统构建方案,但是三类系统在医疗领域仍然存在以下两个共性的问题:
(1)病人相似性度量系统中病人监督信息的获取十分困难,这个过程需要领域专家人工地对病人进行判断,同时收集整理这些专家信息的操作也是一个耗时耗力的过程;
(2)在某些特殊疾病领域,病人样本的数量十分有限,无法有效利用现有系统中的方法得到病人样本集中的度量信息,这就直接导致了该疾病领域在病人相似性度量系统中是一个“灰色领域”,无法被使用和研究;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710136858.4/2.html,转载请声明来源钻瓜专利网。