[发明专利]一种基于数据挖掘的医保欺诈行为的检测方法有效
申请号: | 201410598935.4 | 申请日: | 2014-10-30 |
公开(公告)号: | CN104408547B | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 陈是维;刘成昊;孙建伶;李善平;彭志宇 | 申请(专利权)人: | 浙江网新恒天软件有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/22 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 邱启旺 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 挖掘 医保 欺诈 行为 检测 方法 | ||
技术领域
本发明涉及一种医保欺诈行为的检测方法,更具体地讲,是基于数据挖掘的医保欺诈行为的检测方法。
背景技术
由于医保特有的复杂的委托代理关系和严重的信息不对称,使医疗费用控制难度加大,在利益的驱动下就会产生一些过度医疗服务行为和违规欺诈行为,导致医保基金不合理的流失。
另一方面的话,经办机构的监管力度不足,由于目前采用的基本都是人工审核监管模式,人手有限,而且监管的范围很大,就医量大,专业性强,定点机构分布范围广等等这些特点增加了监管的难度。
我国社会医保工作开展较晚,国内目前已有的研究主要从医疗基金收支监测、简单指标预警等方面开展基金风险管理工作,在医保欺诈行为检测方面,仍处于起步阶段,一些相关研究缺乏系统性和深度。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于数据挖掘的医保欺诈行为的检测方法。
本发明的目的是通过以下技术方案来实现的:一种基于数据挖掘的医保欺诈行为的检测方法,采用基于统计学、聚类、关联分析、随机森林模型的无监督方法对医保参保人的数据记录进行离群点检测,找到离群点对应的异常记录,这些异常记录即为潜在的欺诈行为;具体包括以下步骤:
(1)用统计学方法对医保参保人的信息记录进行离群点检测:根据总费用信息的离群程度对该条记录进行打分,打分范围为0到4分;根据住院天数信息的离群程度对该条记录进行打分,打分范围为0到2分;根据药费信息的离群程度对该条记录进行打分,打分范围为0到2分;根据诊疗费信息的离群程度对该条记录进行打分,打分范围为0到2分;该条记录的总得分为上述四个得分之和,范围为0到10分;具体如下:
(1.1)将所有医保参保人的总费用按升序排序,找出该数据集的第90个、第95个、第98个、第99个百分位数,分别记为Q90,Q95,Q98,Q99;
若该条记录的总费用小于Q90,则得分为0;
若该条记录的总费用大于Q90,小于Q95,则得分为1;
若该条记录的总费用大于Q95,小于Q98,则得分为2;
若该条记录的总费用大于Q98,小于Q99,则得分为3;
若该条记录的总费用大于Q99,则得分为4;
(1.2)将所有医保参保人的住院天数按升序排序,找出该数据集的第90个、第95个百分位数,分别记为Q90,Q95;
若该条记录的住院天数小于Q90,则得分为0;
若该条记录的住院天数大于Q90,小于Q95,则得分为1;
若该条记录的住院天数大于Q95,则得分为2;
(1.3)将所有医保参保人的药费按升序排序,找出该数据集的第90个、第95个百分位数,分别记为Q90,Q95;
若该条记录的药费小于Q90,则得分为0;
若该条记录的药费大于Q90,小于Q95,则得分为1;
若该条记录的药费大于Q95,则得分为2;
(1.4)将所有医保参保人的诊疗费按升序排序,找出该数据集的第90个、第95个百分位数,分别记为Q90,Q95;
若该条记录的诊疗费小于Q90,则得分为0;
若该条记录的诊疗费大于Q90,小于Q95,则得分为1;
若该条记录的诊疗费大于Q95,则得分为2;
(1.5)将步骤(1.1)-步骤(1.4)中的得分相加,即为该条记录基于统计学方法的得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江网新恒天软件有限公司,未经浙江网新恒天软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410598935.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图形化引导展示方法及系统
- 下一篇:一种车辆资源配置方法和系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置