[发明专利]基于医疗单据的可视化报表的方法和系统有效
申请号: | 201810709344.8 | 申请日: | 2018-07-02 |
公开(公告)号: | CN109147879B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 孙字弋 | 申请(专利权)人: | 北京众信易保科技有限公司 |
主分类号: | G16H10/00 | 分类号: | G16H10/00;G16H50/70 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100020 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 医疗 单据 可视化 报表 方法 系统 | ||
本发明涉及基于医疗单据的可视化报表的方法。本发明的方法包括如下步骤:1)采集医疗单据的数据;2)将医疗单据的数据分为疾病数据和患者数据;3)对疾病类别数据进行分析,采用聚类算法,然后用疾病类别分布图谱的方式来呈现分析的结果;4)对疾病人群的数据进行分析,采用人群属性标签算法和关联规则挖掘算法,然后用疾病人群的网络关系图的方法来呈现分析的结果;其中,所述疾病类别数据分析采用聚类算法;所述对疾病人群的数据进行分析是采用Apriori算法做关联规则挖掘。本发明针对医疗大数据的特定性,提出了对这些不同的维度,以统一的方式呈现出来便于疾病防控的分析的解决方案。
技术领域
本发明属于数据或信息处理技术领域,具体涉及医疗大数据的处理,更具体涉及医疗单据的可视化报表的方法和系统。
背景技术
在医疗行业,医疗数据有医院的具体诊疗数据,这类数据一般专业性高,而且主要在医院各科室存储所以普通渠道不易获取。但是医疗单据数据(发票、处方等),由于全部要交给患者持有,所以采集容易,比如保险公司理赔渠道都能获取这类数据。因此,这类医疗单据数据正在呈几何级数的增长。随之而来的问题是:医疗单据大数据可视化系统的极度匮乏。
因为面对海量数据的时候,逐条浏览数据变得没有任何意义。需要可视化系统来生成。而对于可视化系统来说,不同的行业的数据以及数据维度,会带来最终报表呈现上的天壤之别。
随着现在大数据概念的兴起,各行各业开始高度重视本行业各类数据的采集和存储。已知的大数据分析已有一定的应用,如申请号为201610497249的专利申请涉及基于大数据分析建立疾病云图的方法,申请号为201710150587.8的专利申请涉及智慧环保大数据可视化方法。但是医疗大数据具有其特定性,比如涉及有疾病,疾病类别,患者有年龄、性别等属性。如何将这些不同的维度,以统一的方式呈现出来便于疾病防控的分析,是一个需要解决的问题。
发明内容
针对上述需求,本发明提供一种基于医疗单据的可视化报表的方法。
本发明的一种基于医疗单据的可视化报表的方法,主要包括下述流程:
1)采集医疗单据的数据
2)将医疗单据的数据分为疾病数据和患者数据
3)对疾病类别数据进行分析,采用聚类算法,然后用疾病类别分布图谱的方式来呈现分析的结果
4)对疾病人群的数据进行分析,采用人群属性标签算法和关联规则挖掘算法,然后用疾病人群的网络关系图的方法来呈现分析的结果
其中,上述疾病类别数据分析的方法如下:
根据医疗单据上的处方和诊断证明中的疾病名称来获得疾病数据的来源。
主要使用ICD10医疗目录,作为树状结构目录,然后将具体疾病,这个目录树上做聚类算法。具体过程为:
A)以关系型数据方式整理出icd10目录,分DS1,DS2,DS3三个级别
B)以相似度查找的方法,同时加以纠错的方式定位到具体的疾病记录DS3
查找的具体方法,是遍历单据上疾病,计算它和DS3级别疾病的编辑距离。
算法如下:
B1)str1或str2的长度为0返回另一个字符串的长度。if(str1.length==0)return
B2)初始化(n+1)*(m+1)的矩阵d,并让第一行和列的值从0开始增长。扫描两字符串(n*m级的),如果:str1[i]==str2[j],用temp记录它,为0。否则temp记为1。然后在矩阵d[i,j]赋于d[i-1,j]+1、d[i,j-1]+1、d[i-1,j-1]+temp三者的最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京众信易保科技有限公司,未经北京众信易保科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810709344.8/2.html,转载请声明来源钻瓜专利网。