[发明专利]基于互联网一体化医疗平台的临床文档结构化处理方法在审
申请号: | 201910101984.5 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109785927A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 高建强;赵戈;徐龙章 | 申请(专利权)人: | 上海众恒信息产业股份有限公司 |
主分类号: | G16H15/00 | 分类号: | G16H15/00;G16H30/20;G16H70/00;G06F16/25 |
代理公司: | 上海集信知识产权代理有限公司 31254 | 代理人: | 洪玲 |
地址: | 200040 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构化处理 临床文档 医疗平台 互联网 一体化 引擎 分布式数据存储 人工智能算法 分布式存储 分布式计算 分布式特性 结构化数据 非结构化 机器学习 临床数据 临床医学 平台分析 全文检索 软件应用 文本数据 结构化 语料库 适配 编程 存储 输出 改造 展示 | ||
1.基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于:包括以下步骤,
S1、临床文档结构化处理引擎接收非结构化临床文档的输入,通过临床医学语料库、规则、全文检索及机器学习等手段,将非结构化的文本数据转化为结构化的样本与指标数据;
S2、临床文档经过结构化处理引擎处理之后,得到的结构化数据即样本与指标的键值对,存储到分布式存储引擎中,以供平台的分析、展示。
2.如权利要求1所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述临床文档结构化处理引擎包括中文自然语言处理模块、临床医学语料库构建模块、样本指标提取模块,中文自然语言处理模块分别于临床医学语料库构建模块、样本指标提取模块相连。
3.如权利要求2所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述中文自然语言处理模块利用中文自然语言处理技术,从词、句、段落层次对输入的临床文档进行处理,处理步骤如下:
(1)切分短句:根据临床文档的文本叙述特点,利用文句的表达规则,将临床文档的文本内容切分为一个个描述样本的短句;
(2)中文分词:利用中文分词工具,基于通用医学词库和临床医学词库,对样本短句进行分词,得到有意义的词或者词组;
(3)词性分析:分析每个词的词性;
(4)句法分析:对于具体的样本短句,将其与临床文档中描述同一样本的短句进行比较,总结归纳出每种样本描述的短句句法。
4.如权利要求2所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述临床医学语料库构建模块是由临床文档学习训练得到的临床医学专用词料库,该模块的构建步骤如下:
(1)新词发现:利用词频统计、聚类方法,对分词进行组合,发现新词;
(2)同义词发现:对于临床文档中存在的同义词,基于临床文档的文本内容,利用模糊匹配、统计分析手段,得到同义词,建立同义词表;
(3)样本提取:在切分的短句中,根据规则,提取样本名;
(4)模板提取:针对具体的样本,提取该样本的描述模板。
5.如权利要求2所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述样本指标提取模块针对每个样本,通过全文检索和模糊匹配的方式,结合临床医学语料库和样本描述模板,从临床文档中确定指标名对应的指标值;所述样本与指标形成键值对,作为结构化处理引擎的处理结果输出。
6.如权利要求1所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述临床文档包括电子病历、病理报告、检查检验报告。
7.如权利要求6所述的基于图像识别的粮食收割运输一体化装载方法,其特征在于,所述检查检验报告包括超声、X光、CT报告。
8.如权利要求1所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述分布式存储引擎采用多个标准服务器节点组成分布式存储集群,每个Hadoop集群包含一个主节点和多个从属节点;主节点运行NameNode和JobTracker功能,并负责协调从属节点来确保完成提供给集群的任务;从属节点运行TaskTracker和用于存储数据的HDFS,具有执行数据计算的映射和化简功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海众恒信息产业股份有限公司,未经上海众恒信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910101984.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于单位端的检报处理方法及装置
- 下一篇:诊疗方案推荐方法、装置及存储介质