[发明专利]基于有监督学习模型的异常数据识别方法及相关设备在审
申请号: | 202010606953.8 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111783871A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 刘婧媛;张旭 | 申请(专利权)人: | 平安医疗健康管理股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;孙芬 |
地址: | 200001 上海市黄浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 模型 异常 数据 识别 方法 相关 设备 | ||
本发明涉及人工智能技术领域,提供一种基于有监督学习模型的异常数据识别方法,包括:接收携带有数据标识的就诊单据数据;对就诊单据数据进行特征处理,获得特征数据;将特征数据输入至有监督学习的组合分类器模型中,获得就诊单据数据的二次异常识别结果;判断二次异常识别结果与数据标识所标识的异常状态是否保持一致;若一致,确定二次异常识别结果为就诊单据数据的精准识别结果。本发明还涉及区块链技术,可以将就诊单据数据的精准识别结果上传至区块链。本发明可应用于智慧医疗场景中,从而推动智慧城市的建设。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于有监督学习模型的异常数据识别方法及相关设备。
背景技术
随着社会医疗保障制度的不断完善,人们的看病就医问题得到了解决。实践中发现,有些非法用户会捏造医疗数据去报销医疗费用,如果这些非法用户报销的医疗费用数额很大,将会导致没有足够的资金来保障合法用户的医疗报销,这无疑会影响合法用户的合法权益。因此,需要去对医学数据进行异常风险识别。
然而,传统的无监督学习模型存在诸多问题,比如,输出结果过多假阳性率高、过度依赖医学规则经验复用性差,这使得对异常风险的识别能力较弱。
发明内容
鉴于以上内容,有必要提供一种基于有监督学习模型的异常数据识别方法及相关设备,能够提高对异常风险的识别能力。
本发明的第一方面提供一种基于有监督学习模型的异常数据识别方法,其特征在于,所述基于有监督学习模型的异常数据识别方法包括:
接收携带有数据标识的就诊单据数据,其中,所述数据标识用于标识所述就诊单据数据的异常状态,所述异常状态包括正常或异常;
对所述就诊单据数据进行特征处理,获得特征数据;
将所述特征数据输入至有监督学习的组合分类器模型中,获得所述就诊单据数据的二次异常识别结果,其中,所述组合分类器模型是基于多个基分类器的有监督学习训练得到的;
判断所述二次异常识别结果与所述数据标识所标识的异常状态是否保持一致;
若所述二次异常识别结果与所述数据标识所标识的异常状态保持一致,确定所述二次异常识别结果为所述就诊单据数据的精准识别结果。
在一种可能的实现方式中,所述就诊单据数据为源数据或模型结果数据;若所述就诊单据数据为源数据,则所述数据标识是预先标注的;若所述就诊单据数据为模型结果数据,则所述数据标识是经其他模型进行初次识别后获得的。
在一种可能的实现方式中,所述基于有监督学习模型的异常数据识别方法还包括:
若所述二次异常识别结果与所述数据标识所标识的异常状态不一致,且所述就诊单据数据为模型结果数据,向医学设备发送携带有所述就诊单据数据的校验请求,所述校验请求用于请求所述医学设备所属的医学用户对所述就诊单据数据进行异常校验;
接收所述医学设备针对所述校验请求返回的校验结果;
将所述校验结果确定为所述就诊单据数据的精准识别结果。
在一种可能的实现方式中,所述基于有监督学习模型的异常数据识别方法还包括:
若所述二次异常识别结果与所述数据标识所标识的异常状态不一致,且所述就诊单据数据为模型结果数据,获取所述模型结果数据所对应的初始模型;
对所述初始模型与所述组合分类器模型进行再次训练,获得最优模型;
使用所述最优模型对所述就诊单据数据进行识别,获得所述就诊单据数据的精准识别结果。
在一种可能的实现方式中,所述基于有监督学习模型的异常数据识别方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安医疗健康管理股份有限公司,未经平安医疗健康管理股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010606953.8/2.html,转载请声明来源钻瓜专利网。