[发明专利]一种基于Hbase的医疗数据管理方法及其系统有效
申请号: | 202011551935.0 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112687364B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 黄晓琴;谢建斌;陈名扬;张恒瑞 | 申请(专利权)人: | 宁波金唐软件有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/332;G06F16/31 |
代理公司: | 宁波甬致专利代理有限公司 33228 | 代理人: | 李迎春 |
地址: | 315000 浙江省宁*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hbase 医疗 数据管理 方法 及其 系统 | ||
1.一种基于Hbase的医疗数据管理方法,其特征在于,包括:
S1、将结构化数据和非结构化数据存入Hbase数据库中,生成对应的一级索引Rowkey;将结构化数据和非结构化数据存入Hbase数据库中的具体步骤包括:
A1、从电子病历库中,关联抽取历史数据,经过数据处理后写入ODS层的中间库临时表中;数据处理的具体过程为:A11、根据非结构化数据在医疗中的作用进行文档分类,得到文档分类类型数据;A12、对结构化数据以及分类后的非结构化数据进行数据预处理;
A2、通过SparkSql连接ODS层的中间库临时表,抽取临时表中的数据进行Hbase表的适应性格式转化,将转化后的结构化数据和非结构化数据导入到Hbase表中,通过一级索引Rowkey对结构化数据和非结构化数据进行关联匹配;
S2、根据结构化数据和非结构化数据以及一级索引Rowkey在Solr中构建二级索引;构建二级索引的具体步骤包括:
B1、扫描Hbase表中的数据,对每一行数据进行Hbase表字段到二级索引字段的映射处理;
B2、以非结构化数据的文档分类类型数据作为二级索引文档的主题,使用医疗字典对非结构化数据进行分词处理并在Solr中以倒排索引形式存储,并结合其对应的结构化数据、非结构化数据以及对应的一级索引Rowkey构建二级索引文档;
B3、批量提交到SolrCloud中构建索引文档,建立二级索引;
S3、输入非结构化数据形式的检索文本,使用医学词典对检索文本进行分词处理,提取关键词;
S4、使用关键词与步骤S2中得到的二级索引进行匹配;
S5、使用二级索引调取一级索引Rowkey,并进一步由一级索引Rowkey调取Hbase数据库中对应的数据。
2.根据权利要求1所述的一种基于Hbase的医疗数据管理方法,其特征在于,所述步骤S1还包括:定时向Hbase中写入增量数据。
3.根据权利要求2所述的一种基于Hbase的医疗数据管理方法,其特征在于,所述步骤S1的写入增量数据包括下列步骤:
D1、定时从病历库中抽取前N天的病历数据,并关联得到各业务域信息,然后导入临时增量表中;
D2、抽取临时增量表中的数据写入到Hbase数据库中,并保存一级索引Rowkey;
D3、根据D2中保存的Rowkey和对应的结构化数据和非结构化数据建立二级索引。
4.根据权利要求1所述的一种基于Hbase的医疗数据管理方法,其特征在于,所述S5中从Hbase数据库中调取得到的数据为结构化数据或/和非结构化数据。
5.一种用于实现权利要求1至权利要求4任意一项所述的方法的医疗数据管理系统,其特征在于,包括数据预处理模块,与数据预处理模块连接的Hbase数据存储处理模块,以及与Hbase数据存储处理模块连接的二级索引模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波金唐软件有限公司,未经宁波金唐软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011551935.0/1.html,转载请声明来源钻瓜专利网。