[发明专利]一种医疗数据的处理方法及装置在审
申请号: | 201810796918.X | 申请日: | 2018-07-19 |
公开(公告)号: | CN108986919A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 尹浩;查聪 | 申请(专利权)人: | 清华大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H10/60 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华;王宝筠 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗数据 数据转换 组织形式 标准化 随机数 预设 数据组织形式 哈希运算 可追溯性 生成方式 数据挖掘 最小单位 数据项 泄露 申请 分析 统一 | ||
本申请提供了一种医疗数据的处理方法及装置,以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据,将所述就诊数据转换为预设的组织形式,得到标准化的就诊数据,所述预设的组织形式中的数据项包括:医疗数据标识,所述医疗数据标识通过将病人的信息插入随机数,并将插入随机数的病人的信息进行哈希运算生成。基于医疗数据标识的生成方式,医疗数据标识能够代表用户但不会泄露用户的信息,并且,将就诊数据转换为标准化的就诊数据,使得就诊数据具有统一的数据组织形式,所以,标准化的就诊数据具有较高的可追溯性和流通性,为后续的数据挖掘和分析奠定了基础。
技术领域
本申请涉及大数据领域,尤其涉及一种医疗数据的处理方法及装置。
背景技术
随着大数据时代的来,大数据在人类生活中扮演着越来越重要的作用。在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。信息经济阶段将迎来大数据时代,数据的收集、挖掘、连接、分析和运用,成为国家综合竞争力的新标志。医疗大数据对于精准医疗、疾病风控和预警等有着重要的意义。目前医疗大数据也是随着医疗资源的数字化进程而突飞猛进。医院信息化程度日趋成熟,医院信息系统(HIS)、电子病历系统(EMR)、影像采集与传输系统(PACS)、实验室检查信息系统(LIS)、病理系统(PS),甚至包括手术管理系统、耗材及物流管理系统等等。这些信息系统每日产生大量的数据,多源异构的数据类型汇聚在一起。随着各类工作数字化程度的增高,数据量的累计已经进入到EB(计算机存储单位,全称Exabyte,中文名为艾字节,64位计算机系统的可用最大的虚拟内存空间为1EB,数据转换公式1EB=1024PB=1152921504606847000B)级,并很快将进入ZB(计算机存储单位,中文名为泽字节,全称Zettabyte,代表的是十万亿亿字节)级别。
然而目前医疗数据存储于医院内由不同公司设计和开发的各个子系统中,形成了若干的数据孤岛,数据难以进行流通。数据被困在医院系统内部,只能被本院的医生所使用,难以产生更大的价值。
并且,医疗数据对隐私性有极高的要求,在非脱敏(脱敏是指去除所有和病人身份信息相关的信息,并不做标记)的情况下流通会涉及严重的伦理性问题。目前医院对于医疗数据进行完全的脱敏处理,但是完全脱敏后的数据无法对一个人多年的病史形成连续的记录和分析,难以形成更多有价值的成果。
综上所述,目前的医疗数据,很难形成医疗大数据,被用于数据挖掘和分析。
发明内容
本申请提供了一种医疗数据的处理方法及装置,目的在于解决如何将医疗数据处理成为可用于数据挖掘和分析的医疗大数据的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种医疗数据的处理方法,包括:
以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据;
将所述就诊数据转换为预设的组织形式,得到标准化的就诊数据,所述预设的组织形式中的数据项包括:医疗数据标识,所述医疗数据标识通过将病人的信息插入随机数,并将插入随机数的病人的信息进行哈希运算生成。
可选的,所述预设的组织形式中的数据项还包括:
哈希值;
所述哈希值依据所述预设的组织形式中的所有数据项进行哈希运算得到。
可选的,所述预设的组织形式中的数据项还包括:
本次就诊信息;
所述本次就诊信息包括:诊疗时间、医院、籍贯、性别、年龄、疾病种类、检查项目、诊疗结果和病历信息。
可选的,所述预设的组织形式中的数据项还包括:
数据版本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810796918.X/2.html,转载请声明来源钻瓜专利网。