[发明专利]一种基于大数据的血液病智能分类系统在审
申请号: | 201711376232.7 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107945871A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 袁斌;赵鹏;骆英华 | 申请(专利权)人: | 贵州医科大学附属医院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06F17/30 |
代理公司: | 北京国坤专利代理事务所(普通合伙)11491 | 代理人: | 赵红霞 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于医疗信息化系统领域,公开了一种基于大数据的血液病智能分类系统,设置有信息输入模块、服务器、数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数据生成模块、病例数据库检索模块;病例分类模块;病例生成模块、数据显示模块。本发明通过以上系统的运行可以通过输入的病人信息自动生成病例分类,结构简单,操作简便,通过大数据库的应用,可以准确无误的对病人的疾病进行分类,大大的减少了医生的负担,而且精准度高,非常适合推广使用。 | ||
搜索关键词: | 一种 基于 数据 血液病 智能 分类 系统 | ||
【主权项】:
一种基于大数据的血液病智能分类系统,其特征在于,所述基于大数据的血液病智能分类系统包括:信息输入模块、服务器、数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数据生成模块、病例数据库检索模块;病例分类模块;病例生成模块、数据显示模块。所述服务器包括数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数据生成模块、病例数据库检索模块;病例分类模块;病例生成模块;所述数据采集模块、数据存储模块、所述数据分割模块、特征病理信息提取模块、数据预处理模块、特征数据生成模块、病例数据库检索模块;病例分类模块;病例生成模块依次首尾电连接;所述数据采集模块数据聚合方法的步骤如下:步骤一,在面积为S=LL的部署区域内,随机分布N个同构的无线传感器节点,sink节点位于部署区域之外,节点处理整个无线传感器网络内收集到的数据;步骤二,非均匀成簇sink节点位于部署区域的上方;首先部署区域X轴划分为S个泳道,所有泳道有相同的宽度w,并且每个泳道的长度与部署区域的长度相等;用从1到s作为泳道的ID,最左端的泳道的ID为1,然后每个泳道沿着y轴划分为多个矩形网格,每个泳道中的每个网格都被定义一个水平,最下端的网格的水平为1,每个网格和每个泳道有相同的宽度w;每个泳道中网格的个数、长度与泳道到sink的距离有关;通过设置网格的长度来调整网格的大小;针对不同的泳道,距离sink越远的泳道含有的网格数目越小;针对同一泳道,距离sink越远的网格的长度越大;假设A中含有S个元素,第k个元素表示在第k个泳道中网格的数目;每个网格用一个数组(i,j)作为ID,表示第i个泳道有水平j;定义S个数组表示网格的长度,第v个数组Hv表示第v个泳道中网格的长度,并且Hv的第w个元素hvw表示网格(v,w)的长度;网格(i,j)的边界为:o_x+(i‑1)×w<x≤o_x+i×wo_y+Σk=1k≤j-1hik<y≤o_y+Σk=1k≤j-1hik]]>非均匀网格划分好之后进行成簇阶段;算法分为很多轮进行,在每轮中选取每个网格中剩余能量最大的节点作为簇首节点,其余节点根据就近原则加入簇,然后再进行数据聚合;步骤三,格拉布斯预处理传感器节点需要对收集的数据进行预处理,然后再向簇首节点传输数据;采用格拉布斯预准则对传感器节点所采集到的数据进行预处理假设某个簇首节点含有个传感器节点,传感器节点收集到的数据为x1,x2,…,xn,服从正态分布,并设:x0=1nΣi=1nxi,vi=xi-x0,δ=1nΣi=1nvi;]]>根据顺序统计原理,计算格拉布斯统计量:gi=xi-x0δ;]]>给定显著性水平(α=0.05)之后,测量值满足gi≤g0(n,α),则认为测量值有效,测量值参与到下一层次的数据聚合;反之,则认为测量值无效,因此需要剔除,即不参与到下一层次的数据聚合;步骤四,自适应聚合算法通过迭代得到各个节点测量数据的无偏估计值,求取各个传感器节点的测量数据值与估计值之间的欧式距离,以归一化的欧式距离作为自适应加权融和的权值;选用簇中的传感器节点采集到的数据的最大值与最小值的平均值作为中心数据;某个簇中有个传感器节点,用维列向量D=(d1,d2,…,dn)表示相应节点的测量值,通过计算各个节点数据与中心数据的欧式距离反应不同节点数据与中心数据之间的偏差大小,其中li的计算公式为:li=(di-T)2;]]>根据欧式距离自适应设定相应的权值大小,距离越大权值越小,距离越小权值越大;wi=1/(li/Σi=1n1/li);]]>其中wi为相应的权值;所述数据存储模块数据压缩方法的步骤为:步骤一、在编码时,首先根据E1n+1=E1n+dn+1式计算出E1值,再根据和式计算出拟合残差,计算这两步时,均需要对结果进行越限判断,判断E1是否越限是为了避免超过传感器数据总线上限而造成溢出;判断残差是否越限是为实现分段拟合;步骤二、当一段输入数据的拟合残差全部计算完后,就构造出{dn,E1n,DFR3,DFR4,…DFRn}所示的数据包,通过S‑Huffman编码方法对进行熵编码,然后发送出去,接收端解码时,先将接收到的一组数据解码,还原出{dn,E1n,DFR3,DFR4,…DFRn}式所示的数据包,然后根据式计算并还原出所有原始数据;所述信息输入模块可以输入病人血液信息,输入的病人信息依次进入到数据采集模块、数据存储模块、数据分割模块、特征病理信息提取模块、数据预处理模块、特征数据生成模块、病例数据库检索模块;病例分类模块;病例生成模块中,生成的病例输入到数据显示模块以自动生成病例分类;所述病例分类模块的多源异构数据语义集成模型包括:局部本体构建模块、本体合并模块和语义查询动态扩展及规约模块;局部本体构建模块,根据数据源特征,自适应地选择本体构建策略,从而构建出油气勘探局部本体;本体合并模块,与局部本体构建模块连接,采用将概念匹配和属性匹配相结合的本体合并方法,利用最大信息系数(MIC)方法计算概念语义相似度和概念属性的语义相似度,实现多个局部本体到领域本体的灵活合并;语义查询动态扩展及规约模块,与局部本体构建模块连接,用于查询请求动态扩展的有效性及结果的聚合优化;局部本体构建模块,根据数据源特征,通过自适应本体构建策略,进行局部本体的构建,具体包括:步骤一、基于非结构化数据源构建局部本体:首先,应用文本过滤器将不同的文件格式转成为纯文本文件格式,获得语料数据,并进行一致性检查;然后,采用逆向最大分类中文分词方法对这些语料进行初步的切分处理,得到字串集合;然后,利用最大信息系数(MIC)方法计算字串的内部结合强度,获取合成词集合,并判断合成词和非合成词的领域相关性,提取出概念集合;然后,应用图上随机游走算法推理合成词概念间的分类关系,采用基于隐Markov模型(HMM)的聚类算法提取非合成词概念间的分类关系;接着,运用基于关联规则挖掘的方法获取概念间的非分类关系;最后,应用本体构建工具输出OWL格式的局部本体;步骤二,基于结构化数据源构建局部本体:首先,利用R2O技术建立数据库模式和本体模型之间的语义映射关系,从而把关系数据库中的关系映射为本体中的概念,把属性对应地映射为OWL属性,并把数据库的关系表转化为本体类,把数据库中的数据转化为实例;然后,对从数据库中抽取出来的初始局部本体做一系列的规范化工作,通过与标准本体进行语义相似度计算,将符合阈值的本体信息建立语义联系,不符合阈值的本体信息进行规范化处理,从而构建出符合要求的规范化局部本体;步骤三,基于半结构化数据源构建局部本体由于半结构化数据是介于结构化和非结构化数据之间的、具有隐含结构但缺乏固定或严格结构的一类数据;所以,基于上述两种数据类型的本体构建技术也可以应用到半结构化数据源;首先,抽取出半结构化数据模式,给定映射规则,利用XML2RD方法,将半结构化数据转化为结构化数据;然后,按照结构化数据构建局部本体的方法构造半结构化数据源对应的局部本体;本体合并模块合并的方法为:采用将概念匹配和属性匹配相结合的本体合并方法,利用最大信息系数(MIC)方法计算概念语义相似度和概念属性的语义相似度,然后,通过相似度评估函数对概念间的相似度进行评估,输出相似矩阵,并对相似矩阵运用领域公理约束知识进一步评估其相似性;接着,通过机器学习的方法训练学习分类器,利用学习分类器计算概念实例间的相似度;最后,通过结合ISO15926油气本体和模糊形式概念分析方法,综合考虑语义相似度的对称性和传递性关系,将模糊集理论引入语义相似度的设定中,实现多个局部本体到领域本体的灵活合并;语义查询动态扩展及规约模块实现的具体方法为:首先,借助社会标注语义分析和本体包含的概念关系及推理能力,对查询请求进行语法及语义上的规约与扩展,生成规范的语义查询语句,解决查询请求与领域本体数据源之间由于表达形式的不同所造成的失配问题,并根据用户的查询请求自动推荐一簇语义相关标签,为实现数据源准确聚集提供导引;然后,通过计算扩展查询请求和领域本体概念间的语义相似度来量化请求与资源概念间的关联度;最后,利用社会标注和本体包含的丰富概念语义关系,对查询结果模式进行语义注释,根据社会标注的语义全局效应,引入以统计分析结果获得的最相关可信性标注所指向的数据源作为查询结果可信性评价标准之一,对结果集进行去重和聚合优化,实现可信的Top‑K查询。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州医科大学附属医院,未经贵州医科大学附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711376232.7/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置