[发明专利]一种基于图聚类分析的医保骗保行为检测方法及预警装置在审
申请号: | 202110136938.6 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112884593A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 吴健;姜晓红;应豪超;徐黎明 | 申请(专利权)人: | 浙江大学山东工业技术研究院 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06K9/62 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 杜放 |
地址: | 277000 山东省枣庄*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 聚类分析 医保 行为 检测 方法 预警 装置 | ||
1.一种基于图聚类分析的医保骗保行为检测方法,其特征在于包括以下步骤:
S1、数据提取与脱敏,从医保数据库中提取参保人所有的结算记录,以机构为单位进行划分并进行预处理;
S2、预处理与建图,将步骤S1中提取出的结构化数据进行预处理,根据分组后参保人的购药行为构建图模型;
S3、图模型剪枝,结合群体就医骗保行为的特征对步骤S2建立的图模型进行剪枝;
S4、图聚类分析,根据步骤S3的图聚类结果,对图中的参保人节点划分为不同的社区,并在每个社区内提取这个社区中所有无相关关系的团,视为可能存在的团体购药异常群体;
S5、阈值后处理和结果提取,对步骤S4中得到的所有异常群体,提取整个团体的群体购药的明细数据并据此计算异常群体每次购药交易的平均时间间隔,去除平均时间间隔较大的群体后的结果作为异常结果进行输出。
2.根据权利要求1所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述步骤S1中的机构为医疗机构,至少包括药店、诊所、社区卫生服务中心。
3.根据权利要求2所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述步骤S1还包括:将政府医保系统中带有个人敏感信息的原始数据进行脱敏处理,再导出到工作系统当中并转至安全的工作系统中进行oracle数据的存储。
4.根据权利要求1所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述步骤S2还包括:
S21、提取图聚类分析所必要的维度作为图分析的数据并去掉重复记录;
S22、将步骤S21所提取的记录按机构和日期进行分组;
S23、将一家机构一天范围内的有购药记录的任意两个参保人视为可能存在异常群体关系,在图模型中将两个参保人对应的顶点之间的边权加1,遍历整个数据集构建图模型。
5.根据权利要求4所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述维度包括就诊流水号、参保人ID、机构名称和结算时间。
6.根据权利要求1所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述步骤S3还包括去除图模型中边权小于群体购药次数阈值的所有边,以及去除没有边的孤立的点,该点为参保人。
7.根据权利要求1所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述步骤S4采用将贪心算法和快速模块度最大化相结合的社区发现算法,对于每个社区调用networkx函数包中的find_cliques函数寻找存在的团并进行去重处理。
8.根据权利要求5所述的一种基于图聚类分析的医保骗保行为检测方法,其特征在于所述步骤S5还包括通过在总交易记录中的就诊流水号和参保人ID信息唯一确定的交易来提取群体购药的整个明细数据,通过平均时间的阈值超参数对数据训练和验证,确定超参数的最佳值。
9.一种基于图聚类分析的医保骗保行为的预警装置,其特征在于包括:
存储器,用于存储计算机的可执行指令、和在执行所述可执行指令时使用或产生的数据;
处理器,用于执行存储器存储的计算机可执行指令,与所述存储器通信连接;
所述预警装置用于实现如权利要求1-8中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学山东工业技术研究院,未经浙江大学山东工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110136938.6/1.html,转载请声明来源钻瓜专利网。