[发明专利]精准医学大数据分析处理系统在审
申请号: | 201910219554.3 | 申请日: | 2019-03-22 |
公开(公告)号: | CN110096495A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 明炬;杨峰 | 申请(专利权)人: | 武汉明炀大数据科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/25;G06F16/27;G16H50/70 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 方琳 |
地址: | 430000 湖北省武汉市东湖新技术开发区关山*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学数据 分布式数据库 分析处理系统 数据可视化 数据搜索 数据转换 主数据库 大数据 采集 分析处理模块 存储要求 错误数据 分析判断 结构转换 数据清洗 数据形式 文本内容 重复数据 校验 医学 调取 删除 搜索 文本 传输 纠正 审查 | ||
1.精准医学大数据分析处理系统,其特征在于,包括:
数据采集模块:用于对医学数据进行采集,并对采集到的医学数据进行数据清洗,以对采集的医学数据进行审查和校验、删除重复数据、纠正错误数据,然后进行数据转换,以将医学数据的结构转换为符合存储要求的数据形式,最后将数据转换完成得到的医学数据传输至主数据库或分布式数据库或Hadoop子系统;采集到的医学数据包括结构化医学数据、半结构化医学数据和非结构化医学数据;
分布式数据库:用于存储经过数据清洗和数据转换的医学数据中的分布式结构化医学数据,并对分布式结构化医学数据进行分布式计算、数据深度分析和数据挖掘,以将分布式结构化医学数据进行关联和汇总,并能够向主数据库输出关联和汇总后的医学数据集合;
主数据库:用于存储经过数据清洗和数据转换的医学数据;主数据库中的半结构化医学数据和非结构化医学数据可以加载到Hadoop子系统中进行Hadoop处理,结构化医学数据可以加载到分布式数据库中进行存储;
Hadoop子系统:用于存储经过数据清洗和数据转换的医学数据中的半结构化医学数据和非结构化医学数据,并对所述半结构化医学数据和非结构化医学数据进行Hadoop处理,得到新的结构化医学数据并加载到分布式数据库,结构化医学数据则不需要处理,直接加载到分布式数据库;
人机交互平台:用于提供数据搜索窗口和数据可视化窗口,用户在数据搜索窗口中输入需要搜索的医学数据的相关文本,分析处理模块对所述文本内容进行分析判断,选择从主数据库或分布式数据库或Hadoop子系统中调取医学数据,并在数据可视化窗口中显示所述医学数据;
分析处理模块:用于判断所需调取的医学数据的类别,选择从主数据库、分布式数据库和Hadoop子系统中的一个或多个中调取与所述输入文本相关的医学数据,并运用数据挖掘算法在主数据库、分布式数据库和Hadoop子系统中进行数据挖掘,以调取完整精确的医学数据。
2.根据权利要求1所述的精准医学大数据分析处理系统,其特征在于,数据采集模块采用数据仓库技术ETL对医学数据进行采集。
3.根据权利要求1所述的精准医学大数据分析处理系统,其特征在于,分布式数据库通过操作数据存储ODS存储经过数据清洗和数据转换的医学数据中的分布式结构化医学数据,且数据存储支持PB级。
4.根据权利要求1所述的精准医学大数据分析处理系统,其特征在于,主数据库对存储的医学数据的数据类型、数据结构、数据存储方式没有要求。
5.根据权利要求1所述的精准医学大数据分析处理系统,其特征在于,Hadoop子系统既能够对自身存储的医学数据进行Hadoop处理,也能加载主数据库中的医学数据进行Hadoop处理。
6.根据权利要求1所述的精准医学大数据分析处理系统,其特征在于,结构化医学数据包括各种疾病数据、药物数据、治疗数据和数据之间的关系,半结构化医学数据包括影像数据,非结构化医学数据包括基因数据。
7.根据权利要求1所述的精准医学大数据分析处理系统,其特征在于,分析处理模块中采用的数据挖掘算法包括人工神经网络、决策树ID3算法、聚集、粗糙集中RSL语言。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉明炀大数据科技有限公司,未经武汉明炀大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910219554.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使用源跟踪剖析数据
- 下一篇:一种表单校验方法、相关装置和设备