[发明专利]一种基于症状向量的医学数据处理方法和系统有效
申请号: | 201810343909.5 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108764280B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 商显震;胡满满;陈旭;孙毓忠 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G16H50/70 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 症状 向量 医学 数据处理 方法 系统 | ||
本发明公开了一种基于症状向量的医学数据处理方法和系统,包括:通过将数据库中的症状进行向量化处理,得到由症状向量组成的初始症状集合,并根据初始症状集合得到疾病向量,集合疾病向量作为初始疾病集合;获取多个病例样本,根据病例样本的样本向量与疾病向量间的相似度,并结合损失函数对疾病向量和症状向量进行更新,以将初始疾病集合和初始症状集合分别更新为最终疾病集合和最终症状集合;用户输入症状,根据输入症状与最终症状集合中各疾病向量的相似度,对数据库中的疾病进行筛选,并将筛选出的疾病作为处理结果返回给用户。
技术领域
本发明涉及医疗数据分析领域,特别涉及一种基于症状向量的医学数据处理方法和系统。
背景技术
计算机科学的不断进步与信息技术的迅猛发展为医疗服务行业带来了新的机遇和挑战,智能诊断或疾病预测等医疗信息系统的相关研究极大促进了医疗信息化产业的迅速发展。疾病的诊断离不开对患者的症状和临床表现的辨别与分析,对以自然语言形式描述的症状的分析处理具有越来越重要的意义。
现阶段在疾病辅助诊断领域,许多专家学者从各个技术角度进行研究,产生了大量的理论与实践结果。专利CN 201710259468.6发明公开了一种基于深度学习算法的恶性肿瘤计算机辅助早期诊断方法术,使用深度卷积神经网络逐层提取图像的高层次特征,得到的特征图维度在不断减小。为了实现输出概率预测图和预分割图像的尺寸匹配,该发明使用反卷积网络拓展特征图尺寸,得到尺寸一致的概率预测图。网络生成的概率预测图通过训练一个softmax分类器,对预测图像取二值化,获得最终的前列腺组织的分割结果。
很多专家学者使用深度学习、图像处理等技术进行疾病辅助诊断的研究。专利CN201710306765.1接收上传的待诊患者的病征图像,利用深度学习算法提取所述待诊患者的病征图像的待诊特征,建立待诊特征集,并且将待诊特征集与训练图库中各疾病的标准病征图像的标准特征集进行比对,获得待诊患者的病征图像与疾病的标准病征图像之间的图像相似度,根据图像相似度确定待诊患者患疾病的概率。
自然语言理解的问题要转化为机器学习的问题,第一步肯定是要找一种方法把这些符号数学化。NLP(Neuro-Linguistic Programming)中最直观,也是到目前为止最常用的词表示方法是One-hot Representation(独热表示),这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为0,只有一个维度的值为1,这个维度就代表了当前的词。举个栗子,“话筒”表示为[0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 …],“麦克”表示为[0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 …],每个词都是茫茫0海中的一个1。这种One-hot Representation如果采用稀疏方式存储,会是非常的简洁:也就是给每个词分配一个数字ID。比如刚才的例子中,话筒记为3,麦克记为8(假设从0开始记)。简洁的向量表示方法配合最大熵、SVM、CRF等等算法已经很好地完成了NLP领域的各种主流任务。
发明内容
本发明针对目前疾病诊断的查询主要从以下三方面展开:
1、症状的向量化表示与疾病的向量化表示,即在疾病诊断的过程中,对所有的疾病均认为是其所包含症状的组合表示,疾病的向量化表示可基于其所含症状的向量表示进行表示;
2、使用病例样本进行症状向量更新与疾病向量更新,计算病例样本与疾病的向量表示的距离并结合损失函数进行反向迭代更新,本发明设计了疾病与病例样本的向量化表示方法,并设计了距离计算方法与损失函数和迭代更新方法;
3、使用用户输入进行疾病辅助诊断工作,本发明设计了方法应用于疾病辅助诊断系统的工作流程和疾病诊断方法。
需要注意的是本发明并不直接作用于人体,可作为医疗辅助工具,辅助医学教育科研等医学技术领域。
具体来说本发明具体提供了一种基于症状向量的医学数据处理方法,其中包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343909.5/2.html,转载请声明来源钻瓜专利网。