[发明专利]基于CDA共享文档的健康医疗大数据质控系统和终端有效
申请号: | 202010291476.0 | 申请日: | 2020-04-14 |
公开(公告)号: | CN111524589B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 梁娜;汪成亮;吴开明;温海燕 | 申请(专利权)人: | 重庆大学;重庆市卫生健康统计信息中心 |
主分类号: | G16H40/67 | 分类号: | G16H40/67;G06F16/176;G06F16/215;G06F16/25 |
代理公司: | 重庆天成卓越专利代理事务所(普通合伙) 50240 | 代理人: | 王宏松 |
地址: | 400030 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cda 共享 文档 健康 医疗 数据 系统 终端 | ||
1.一种基于CDA共享文档的健康医疗大数据质控系统,其特征在于,包括:
CDA共享文档获取模块,用于从区域医疗大数据中挖掘CDA共享文档,选取若干条CDA共享文档作为样本,利用规则引擎开展数据获取发现,选取若干获取的CDA共享文档;
CDA共享文档筛选模块,用于对CDA共享文档获取模块中的数据进行筛选,通过CDA共享文档获取模块对CDA共享文档进行二次筛选,从中抽取和转换用于数据质量控制的文档;
数据质量控制模块,用于经过CDA共享文档筛选模块筛选之后的区域医疗大数据进行数据质量控制,将构建的CDA共享文档通过评价函数进行质量控制,设置CDA共享文档的筛选阈值,验证CDA共享文档数据安全的有效性和合理性;
以及数据安全预警模块,所述数据安全预警模块包括:
建立CDA共享文档获取向量为X={x1,x2,…,xi}以及CDA共享文档获取时间向量为Y={y1,y2,…,yj},其中x为获取和筛选后的CDA共享文档,i为文档ID,y为时间数据,j为时间戳;
将筛选的CDA共享文档进行离散化处理,形成N个时间段的CDA共享文档,即{x1,x2}→{y1},{x3,x4,x5}→{y2},…,{xi-2,xi-1,xi}→{yj};根据实际CDA共享文档获取时间与时间向量进行对应操作,对应数据具有随机性;
对于时间段T中CDA共享文档,离散化之后,任意两个时间段的CDA共享文档数据评价属性函数满足:
C为共享文档属性值,为xi中与共享文档属性值C的条件概率乘积,为yj中与共享文档属性值C的条件概率乘积,为共享文档属性值C的条件下xi和yj的共享文档和时间数据求和;
符合CDA共享文档数据评价属性函数的CDA共享文档根据安全预警需求建立评价筛选阈值:
Oi,j为CDA共享文档中有效的文档数;Pi,j为CDA共享文档中无效的文档数;Qi,j为CDA共享文档中需要经过评价属性函数评价后的文档数;Countu中的下标u代表权重矩阵的评分,S为全部CDA共享文档,σ2为偏好系数,λ为调节系数。
2.根据权利要求1所述的基于CDA共享文档的健康医疗大数据质控系统,其特征在于,所述CDA共享文档获取模块包括:
类型匹配模块,用于对区域医疗大数据进行类型数据获取,对获取的全部CDA共享文档进行比对,排除空数据和冗余数据,从而在全部CDA共享文档中清洗多余数据;根据CDA共享文档中的标准信息进行数据剔除,其中标准信息的定义是对CDA共享文档中不符合字符类型、字符格式、字符长度的病例数据进行剔除;当进行CDA共享文档剔除过程中,发生逻辑语序错误时,根据逻辑判定原则进行删除操作,对于CDA共享文档中内容空缺进行数据选择优化,针对主要数据缺失,则对CDA共享文档采取剔除方式,如果为次要数据缺失,则对CDA共享文档采取保留方式,对于数据合理性进行筛选剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学;重庆市卫生健康统计信息中心,未经重庆大学;重庆市卫生健康统计信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010291476.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种能溃缩吸能的汽车后排座椅骨架
- 下一篇:一种针对疫情区的网络舆情追踪方法