[发明专利]医保数据处理方法、装置、计算机设备和存储介质有效
申请号: | 202010037445.2 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111259089B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 张旭 | 申请(专利权)人: | 平安医疗健康管理股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/215;G06Q40/08 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 200001 上海市黄浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医保 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及大数据领域,具体涉及一种医保数据处理方法、装置、计算机设备和存储介质。所述方法包括:接收医保终端发送的预设周期内的医保结算数据;根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量;根据参保标识和购药信息生成数据透视表,根据运算数据量按照预设顺序从数据透视表中提取参保标识的透视参数,构建透视矩阵;采用矩阵乘法对透视矩阵进行处理得到共现矩阵,共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数;根据相遇次数对参保标识进行筛选得到违规集合,并将违规集合的参保标识发送给医保终端。采用本方法能够对大批量医保结算数据顺利进行排查,降低系统崩溃的概率。
技术领域
本申请涉及数据清洗技术领域,特别是涉及一种医保数据处理方法、装置、计算机设备和存储介质。
背景技术
通过医疗保险,参保人员可以以低廉的价格购买各种医保药品。出于利益,医药贩子会与参保人合作,提前收集一批参保人的医保卡,利用医保卡批次低价购药,这种行为损害了其他参保人的医保利益,需要及时进行标识,再将被标识的异常数据从大量的医保结算数据中排除。但是,当医保结算数据对应的参保人数量以万为单位时,对应的医保结算数据量成几何增加,有时可以达到数G,超出了计算机系统的运行内存。因而,如何在保证计算机运行的情况下,对大批量医保结算数据顺利进行排查,降低系统崩溃的概率是医保数据处理的难点。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对大批量医保结算数据顺利进行排查,降低系统崩溃的概率的医保数据处理方法、装置、计算机设备和存储介质。
一种医保数据处理方法,所述方法包括:
接收医保终端发送的预设周期内的医保结算数据,所述医保结算数据携带有参保标识和购药信息;
根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量;
根据所述参保标识和所述购药信息生成数据透视表,并根据所述运算数据量按照预设顺序从所述数据透视表中提取所述参保标识的透视参数,构建与所述参保标识对应的透视矩阵;
采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵,所述共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数;
根据所述相遇次数对所述参保标识进行筛选得到违规集合,所述违规集合的所述参保标识对应的相遇次数大于预设阈值,并将所述违规集合中的参保标识发送给所述医保终端。
在其中一个实施例中,所述根据所述参保标识和所述购药信息生成数据透视表,包括:
对所述医保结算数据进行解析抽取,得到结算明细表;
排查所述结算明细表中的异常值,并对应删除所述结算明细表中的异常值;
确定所述结算明细表中与缺失值所在变量最相关的医保结算数据参数,并将所述医保结算数据参数代入缺失值所在变量,得到清洗后的医保结算数据;
采用预设统计规则对清洗后的所述医保结算数据进行统计,得到数据透视表。
在其中一个实施例中,所述根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量,包括:
实时获取运算内存,并根据所述运算内存获取与矩阵计算相关的矩阵运算速度;
获取与所述数据内存对应的运算时间;
根据所述矩阵运算速度和所述运算时间确定运算数据量。
在其中一个实施例中,所述采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵,包括:
从所述数据透视表中提取与所述参保标识对应的透视参数,并根据所述透视参数构建参考矩阵;
计算所述透视矩阵对应的转置矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安医疗健康管理股份有限公司,未经平安医疗健康管理股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010037445.2/2.html,转载请声明来源钻瓜专利网。