[发明专利]一种基于多特征的医疗保险欺诈检测方法有效
申请号: | 201510492558.0 | 申请日: | 2015-08-12 |
公开(公告)号: | CN105159948B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 成都数联易康科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06K9/62 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 医疗保险 欺诈 检测 方法 | ||
本发明公开了一种基于多特征的医疗保险数据欺诈检测方法。该方法针对医疗保险申报数据中患有某一种疾病的所有病人的治疗记录,结合医药分类知识,采用概率统计、混合高斯建模、特征融合等技术提取多种更具区分度的二级特征数据,再基于二级特征数据对病人的治疗记录进行向量化,然后通过将标注为“正常”的治疗数据进行聚类分析后,采用非线性支持向量机分类技术将聚类后的每一类正常治疗数据分别与标注为“欺诈”的治疗数据建立多个分类超平面,以实现对未标注的医疗保险数据进行欺诈检测。该方法能快速、有效地检测医疗保险数据中存在的欺诈数据,具有较高的准确性。
技术领域
本发明涉及欺诈检测识别领域,具体的说是一种医疗保险欺诈行为基于多特征的检测方法和系统。
背景技术
在医疗保障社会体系中,每天都有数以万计的门诊、医院医疗行为的交易数据在发生,交易主要包括病人与医疗机构的交易,医疗机构与保险机构的交易。目前,现有的医疗保险处理系统处理支付交易的时候会存在一些弊端,就是无法识别是否真正的病人需求,容易导致参保人或医疗机构从中谋取利益。据《金融时报》报道,美国政府采用大数据方法鉴别以及间距医保欺诈行为节省了数十亿美元的医疗保险金,在我国同样具有很大的医疗欺诈行为存在,这些行为严重影响了医疗保险基金的收支平衡,侵害了参保人的利益。
当前国内外现有研究来看,医疗保险欺诈检测识别方法主要分为两大类,即监督学习方法(supervised learning method)与非监督学习方法(unsupervised learningmethod)。监督学习方法是指使用数据中部分训练样本中所包含的标注信息(即该样本是否属于欺诈案件),而获取欺诈相关因子,这类方法包括贝叶斯分类器,BP神经网络分类器等。与之相对,非监督学习方法并不依赖与标注信息,而是直接从自变量中发掘识别欺诈相关因子,这类方法包括聚类分析,非辅助的神经网络分析等。随着医疗保险欺诈模式越来越多,现有的欺诈方法越来越难以有效的检测到多变的欺诈案例。
因此,如何开发一种高效且准确率高的欺诈行为识别检测方式已成为亟待解决的问题。
发明内容
本发明针对当前医疗保险欺诈模式多样的问题,提出了一种基于多特征提取的医疗保险欺诈检测方法。该方法针对医疗保险原始数据并结合医药分类知识,提取新的更具有区分度的二级特征数据,然后将非欺诈数据进行聚类分析,每一类与欺诈数据建立分类平面。结合使用了概率统计、高斯建模技术、聚类、分类等方法。能有效适应医保数据记录中欺诈模式多变的情况,并具有良好的实际效果。
(1)、针对某一种疾病,筛选得到医疗保险数据中患有该疾病的所有病人的治疗记录,将病人治疗记录中各种治疗项目(包括各种用药、检查、化验等治疗项目)的用量情况进行向量化。假设某一种疾病病人治疗记录的总数为N,涉及的治疗项目的总数为m,则每一条病人治疗记录可向量化为xi=(xi,1,xi,2,…,xi,m),1≤i≤N,其中xij为第i条病人治疗记录中第j种治疗项目的用量;根据疾病所涉及的m种治疗项目,统计每种治疗项目在所有N条治疗记录中出现的频率,即治疗项目在N条记录中出现的次数与记录总数N的比值,分别记为p1,p2…,pm;
(2)、采用概率统计、高斯建模、特征融合等技术提取多种更具区分度的二级特征数据,将第i条病人治疗记录中提取的二级特征数据记为zi=(zi,1,zi,2,…,zi,G),1≤i≤N,具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联易康科技有限公司,未经成都数联易康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510492558.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:海量数据实时排序查询方法及系统
- 下一篇:信息推送方法和装置