[发明专利]一种基于图聚类分析的医保骗保行为检测方法及预警装置在审
申请号: | 202110136938.6 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112884593A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 吴健;姜晓红;应豪超;徐黎明 | 申请(专利权)人: | 浙江大学山东工业技术研究院 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06K9/62 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 杜放 |
地址: | 277000 山东省枣庄*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 聚类分析 医保 行为 检测 方法 预警 装置 | ||
本发明属于医疗健康大数据的数据挖掘技术领域,尤其是涉及一种基于图聚类分析的医保骗保行为检测方法及预警装置。一种基于图聚类分析的医保骗保行为检测方法,包括以下步骤:S1、数据提取与脱敏;S2、预处理与建图;S3、图模型剪枝;S4、图聚类分析;S5、阈值后处理和结果提取。本发明提供了一种利用不断更新的医保大数据作为输入,经过计算可以及时发现可疑的群体骗保行为的基于图聚类分析的医保骗保行为检测方法及预警装置。
技术领域
本发明属于医疗健康大数据的数据挖掘技术领域,尤其是涉及一种基于图聚类分析的医保骗保行为检测方法及预警装置。
背景技术
近些年,随着人民生活水平不断提高,中国基本医疗保险参与人数已经达到13.5亿人,参保率超过了95%,医疗支出费用从2008年的1.45万亿增长到2015年的4.1万亿,年均增长率达16%,远远超过我国GDP同期增长率。其中很重要的一个原因就是医保欺诈、资源浪费和药物滥用(FWA)。根据联邦调查局估计,在美国每年欺诈占医疗保险的3-10%(大约占190亿美元到650亿美元之间)。着人口老年化加剧,FWA情况愈演愈烈。根据医疗机构的报告,2012年美国FWA总费用为750亿美元。与此同时,传统的欺诈检测是依靠专家调查,这会产生大量的时间成本和人力成本。根据案件难易程度每次调查的费用在200美元到20000美元之间。此外,随着医疗保险数据的爆炸性增长,领域专家人数无法满足现有欺诈案例的筛查。因此,医保欺诈方面有必要投入研究,尽早地发现预防甚至杜绝医疗保险欺诈的发生。
群体就医是常见的多种骗保行为中的一种。基层医疗机构、药店、诊所或民营医疗机构存在恶意收集参保人医保卡,或者“卡头”收集参保人医保卡。从结算数据中,往往表现出就诊结算时间相近、处方医生相对固定、诊断疾病的种类数、开具雷同药品组合或针对同一疾病频繁的变化药品商品名等现象,通过以上分析期望发现就诊类似的一组人进行筛查,确定欺诈骗保群体。
现有的医保大数据自动化异常检测主要分为两个方向:有监督学习和无监督学习。有监督学习指的是利用带标注的数据,也就是已经区分好是否异常的数据,进行模型的训练。有监督学习能够让模型从数据与标注中学习到一个映射关系,引导模型向正确的方向前进,是被动的学习。无监督学习和有监督学习的区别就在于没有提供标注,模型只能从数据中主动的学习其中的关联,通过挖掘数据之间的相似性以及异常,找到感兴趣的模式。相比于无监督学习,由于有监督学习获得了额外的标注信息,模型能够更加明确数据与结果的关系。因此,有监督学习在大多数任务重往往能够取得更好的结果。然而,由于医保数据量巨大,标注成本很高,我们能获得的往往都是没有经过标注的原始数据。在这个时候,无监督学习往往更能发挥其作用,挖掘出数据中的异常行为。
发明内容
本发明所要解决的技术问题是提供一种利用不断更新的医保大数据作为输入,经过计算可以及时发现可疑的群体骗保行为的基于图聚类分析的医保骗保行为检测方法及预警装置。为此,本发明采用以下技术方案:
一种基于图聚类分析的医保骗保行为检测方法,包括以下步骤:
S1、数据提取与脱敏,从医保数据库中提取参保人所有的结算记录,以机构为单位进行划分并进行预处理;
S2、预处理与建图,将步骤S1中提取出的结构化数据进行预处理,根据分组后参保人的购药行为构建图模型;
S3、图模型剪枝,结合群体就医骗保行为的特征对步骤S2建立的图模型进行剪枝;
S4、图聚类分析,根据步骤S3的图聚类结果,对图中的参保人节点划分为不同的社区,并在每个社区内提取这个社区中所有无相关关系的团,视为可能存在的团体购药异常群体;
S5、阈值后处理和结果提取,对步骤S4中得到的所有异常群体,提取整个团体的群体购药的明细数据并据此计算异常群体每次购药交易的平均时间间隔,去除平均时间间隔较大的群体后的结果作为异常结果进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学山东工业技术研究院,未经浙江大学山东工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110136938.6/2.html,转载请声明来源钻瓜专利网。