[发明专利]医疗票据识别方法、装置、设备及存储介质有效
申请号: | 202110256578.3 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112989990B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 谢虹;瞿城 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/41;G06V30/262;G06V30/24;G06V30/148;G06F40/151 |
代理公司: | 北京中巡通大知识产权代理有限公司 11703 | 代理人: | 孟大帅 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 票据 识别 方法 装置 设备 存储 介质 | ||
本发明属于信息识别领域,公开了一种医疗票据识别方法、装置、设备及存储介质,包括获取待识别医疗票据的票据图片、票据类型和票据所属地域,确定待识别医疗票据的类别;根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;根据预设的医疗知识库,对各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果,根据预设的业务规则逻辑进行业务逻辑校验,得到各字段的最终转码识别结果;将各字段的最终转码识别结果按照预设的集成要求集成后输出,有效提升医疗票据识别的准确性和识别效率。
技术领域
本发明属于信息识别领域,涉及一种医疗票据识别方法、装置、设备及存储介质。
背景技术
在保险理赔过程中,保险公司需要用户提交理赔的各项材料,其中,最主要的材料就是用户就诊的医疗票据信息,包括但不限于发票、费用明细、病历及检查检验报告等。但是,用户一般提供的都是图片影像材料而非结构化数据,继而通过保险公司的理赔作业人员在理赔系统中录入,信息获取效率低,并且录入的结构化信息一般仅为影像中的少量信息,大部分的就诊信息都未录入信息,导致信息缺失,影响理赔结果。
为了提高信息获取效率,目前一般采用OCR技术实现信息的自动获取,并且,随着OCR技术的日趋成熟,目前证照、激光打印类图片识别准确率能够达到95%以上。
但是,目前的OCR技术厂商仅提供算法技术,而非整套的解决方案。同时,由于医疗票据本身一般质量都比较差,且医疗票据内的部分就诊信息比较专业领域化,导致现有OCR技术对医疗票据的识别准确率较低,一般在70%~80%左右。
发明内容
本发明的目的在于克服上述现有技术中,医疗票据的识别准确率较低的缺点,提供一种医疗票据识别方法、装置、设备及存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种医疗票据识别方法,包括:
获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;
根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;
根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;
根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;
当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;
将各字段的最终转码识别结果按照预设的集成要求集成后输。
本发明医疗票据识别方法进一步的改进在于:
所述根据票据类型和票据所属地域,确定待识别医疗票据的类别前,包括:将待识别医疗票据的票据图片进行数据质控预处理、数据脱敏预处理和分割切片预处理中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110256578.3/2.html,转载请声明来源钻瓜专利网。