[发明专利]一种基于症状向量的医学数据处理方法和系统有效
申请号: | 201810343909.5 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108764280B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 商显震;胡满满;陈旭;孙毓忠 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G16H50/70 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 症状 向量 医学 数据处理 方法 系统 | ||
1.一种基于症状向量的医学数据处理系统,其特征在于,包括:
向量化处理模块,通过将数据库中的症状进行向量化处理,得到由症状向量组成的初始症状集合,并根据该初始症状集合得到疾病向量,集合该疾病向量作为初始疾病集合;
集合更新模块,用于获取多个病例样本,根据该病例样本的样本向量与疾病向量间的相似度,并结合损失函数对疾病向量和症状向量进行更新,以将该初始疾病集合和该初始症状集合分别更新为最终疾病集合和最终症状集合;
筛选模块,用户输入症状,根据该输入症状与该最终症状集合中各疾病向量的相似度,对该数据库中的疾病进行筛选,并将筛选出的疾病作为处理结果返回给用户;
其中,该损失函数具体为:
其中,mk为病例样本(xi,yi)的疾病集yi中疾病的序号,k表示疾病是yi中的第k个疾病,K表示yi中共有K个疾病标签;
且该集合更新模块包括:
获取该样本向量与该初始疾病集合中疾病向量的距离,通过对距离进行排序,为该样本向量对应的病例样本中各疾病分配序号,以生成损失函数,并通过该损失函数和深度学习优化算法反向优化该初始症状集合,将该初始症状集合更新为该最终症状集合;
使用该最终症状集合重新计算疾病向量,以将该初始疾病集合更新为该最终疾病集合。
2.如权利要求1所述的基于症状向量的医学数据处理系统,其特征在于,该向量化处理模块包括:
使用TransE模型对症状进行向量化处理;
根据以下公式计算疾病向量:
其中,为症状的向量表示,上标k表示症状是疾病Di中的第k个症状,疾病Di中共有K个症状。
3.如权利要求1所述的基于症状向量的医学数据处理系统,其特征在于,
该集合更新模块中对于给定的病例样本(xi,yi),其中xi表示病例样本(xi,yi)的症状集合,表示集合xi中的第j个症状,该病例样本的症状数为J;yi表示病例样本(xi,yi)对应的疾病集合,表示集合yi中的第k个疾病标签,该病例样本的疾病标签数为K,同时疾病标签属于疾病集合D;
该样本向量表示为:
其中,为症状的向量表示,上标j表示症状是病例样本中(xi,yi)的第j个症状,病例样本中(xi,yi)中共有J个症状。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343909.5/1.html,转载请声明来源钻瓜专利网。