[发明专利]医疗大数据多中心整合平台及方法在审
申请号: | 201710946758.8 | 申请日: | 2017-10-12 |
公开(公告)号: | CN107833595A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 薛付忠;季晓康;王永超;高琦;徐聪;王晓鹤;阿力木·达依木;曹瑾;许艺博;蒋正;卞伟玮;李敏;孙苑潆;韩君铭;马官慧 | 申请(专利权)人: | 山东大学;康评健康医疗大数据科技有限公司 |
主分类号: | G16H10/00 | 分类号: | G16H10/00;G06F17/30 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 黄海丽 |
地址: | 250101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 数据 中心 整合 平台 方法 | ||
1.一种医疗大数据多中心整合平台,其特征是,包括:
数据中心服务器,建立并维护标准变量和标准字典;
数据分中心服务器,采集各数据源原始数据,将原始数据存储到对应的数据库中,每个数据库中均包括:变量索引表、人员信息表、检查结果表;对变量索引表、人员基本信息表、检查结果表中的数据进行预处理操作;每个数据库对应唯一编码;
数据应用服务器,用于对数据分中心服务器预处理操作后的数据进行数据利用。
2.如权利要求1所述的一种医疗大数据多中心整合平台,其特征是,所述标准变量,包括:项目代码、项目名称、所属科室、指标解读、数据类型、数据标签、参考范围;
所述标准字典,包括:《疾病和有关健康问题的国际统计分类》ICD10、《中国药典》或阳性体征;
所述标准变量维护,包括:标准项目名称、编码和分类;
所述标准字典维护,根据《疾病和有关健康问题的国际统计分类》ICD10或《中国药典》,对原始数据进行标准化处理和文本结构化处理。
3.如权利要求1所述的一种医疗大数据多中心整合平台,其特征是,
所述预处理是指:
对变量索引表中的每一条数据进行数据处理得到新的数据变量,利用新的数据变量建立新的数据变量索引;依据数据中心服务器的标准变量对变量索引表中的检查项目名称及检查项目名称编码标准化处理;
对人员基本信息表里面的数据进行去重处理;所述去重处理,包括:工作单位去重和身份证号去重;
对检查结果表里面的文本数据转换成结构化数据、依据数据中心服务器的标准字典对检查结果表里面的检查结果名称及检查结果名称编码标准化处理。
4.如权利要求3所述的一种医疗大数据多中心整合平台,其特征是,
所述对变量索引表中的每一条数据进行数据处理得到新的数据变量,利用新的数据变量建立新的数据变量索引,包括:
手动拆分模块,用于人工将病历数据拆分成多个句子变量;
正则匹配模块,用于提取规则数据,即通过正则表达式进行匹配得到的数据;
智能分段模块,根据设定的分隔字符产生新变量;分隔字符自定义;
文本替换模块,用于替换原始数据中错误的表达方式;
截取片段模块,用于根据实际需要截取检查结果中的文字片段;
单位转换模块,用于对数据的单位进行转换,目的是统一数据的度量;
文本结构化模块,将非结构化文本数据处理为结构化变量数据,通过自然语言处理或机器学习的方式对文本数据拆分标准化;
数据标准化模块,通过相似性检测算法以及人工审核的方式,把数据分中心服务器的数据变量与数据中心服务器的标准变量建立一一映射关系。
5.如权利要求1所述的一种医疗大数据多中心整合平台,其特征是,
所述变量索引表里存储KEY数据;所述人员信息表里存储BASE数据;所述检查结果表里存储VALUE数据;KEY数据表示数据变量索引;VALUE数据表示原始数据;BASE数据表示人员基本信息数据;
所述KEY数据,用于索引VALUE数据,包括分组表和对照表,所述分组表用于对数据变量索引进行分组存储;组合类型分组是指检查项目的组合;所述对照表用于对数据变量索引和数据之间的一一对应关系进行存储,并且作为VALUE数据的外键索引,索引同一个检测项目的所有检测值;
所述VALUE数据,是根据原始数据的不同数据类型对原始数据进行存储的表,每一条原始数据都有唯一的索引,所述唯一的索引通过医院的区域编码+机构编码+原始数据的记录编码构成;
所述BASE数据,用于存储人员基本信息,每一个数据提供个体原则上只有一条记录,包括:性别、姓名、婚姻、身份证、电话和邮箱,高度唯一且数据安全要求相对较高;所述BASE数据,包括:人员基本信息表,人员工作单位表和人员与数据的对应关系表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学;康评健康医疗大数据科技有限公司,未经山东大学;康评健康医疗大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710946758.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置