[发明专利]一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质有效
申请号: | 201910756077.4 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110503100B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 符颖;郭建京;周忠诚;张圣栋 | 申请(专利权)人: | 湖南星汉数智科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06K9/62;G16H40/20;G06V30/19 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410000 湖南省长沙市高新开*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 单据 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种医疗单据识别方法,其特征在于,所述医疗单据识别方法包括:
分别获取N张医疗单据图片的打印文本行;
使用医疗单据图片的背景颜色对所述打印文本行进行遮挡,获得N张医疗单据背景填充图像;
从所述N张医疗单据背景填充图像中的每一张医疗单据背景填充图像上截选至少一张长条形医疗单据背景填充图像,得到L张长条形医疗单据背景填充图像,分别对所述L张长条形医疗单据背景填充图像打印从M个医学词条中随机选择的至少一个医学词条,得到印有医学词条的L张长条形医疗单据图像,对所述印有医学词条的L张长条形医疗单据图像进行拟合真实医疗单据操作,得到L张词条图像训练样本;
将所述L张词条图像训练样本输入卷积循环神经网络CRNN模型,对所述CRNN模型进行训练,得到优化参数后的CRNN模型;
通过所述参数优化后的CRNN模型对待识别医疗单据图片进行字符识别,得到字符识别结果;
所述分别获取N张医疗单据图片的打印文本行,包括以下过程:
对预先获取的标准医疗单据图片中的打印字符进行遮挡处理,得到标准打印字符区域;
分别对所述N张医疗单据图片进行边框检测,分别得到所述N张医疗单据图片的尺寸信息,包括:采用形态学操作分别对N张医疗单据图片进行预处理,凸显所述N张医疗单据图片中线条框像素点的对比度;采用自适应色彩阈值分割算法分别将所述N张医疗单据图片的图像像素点进行分离,并结合像素点位置信息分别得到所述N张医疗单据图片的边框的四条线的像素点集合;采用最小二乘法分别对所述N张医疗单据图片的边框的四条线的像素点集合进行直线拟合,分别确定所述N张医疗单据图片的边框直线;分别对所述N张医疗单据图片的边框直线进行延长,确定四条边框直线的交点,根据四条边框直线的交点,确定所述N张医疗单据图片的尺寸信息;
根据所述N张医疗单据图片的尺寸信息与所述标准医疗单据图片的尺寸信息,分别确定所述N张医疗单据图片的缩放比例,按照所述缩放比例分别对所述N张医疗单据图片进行缩放处理,得到所述N张目标医疗单据图片;
分别获取所述N张目标医疗单据图片的第一目标字符的第一位置信息,根据所述第一目标字符的第一位置信息及所述标准打印字符区域,分别在所述N张目标医疗单据图片中确定打印文本行,其中,所述第一目标字符为所述N张目标医疗单据图片的左上角、左下角、右上角、右下角中任一个角的第一个字符。
2.根据权利要求1所述的医疗单据识别方法,其特征在于,所述根据所述第一目标字符的第一位置信息及所述标准打印字符区域,分别在所述N张目标医疗单据图片中确定打印文本行,包括以下过程:
获取所述标准医疗单据图片的第二目标字符的第二位置信息;所述第二目标字符为所述标准医疗单据图片的左上角、左下角、右上角、右下角中任一个角的第一个字符,所述第一目标字符与所述第二目标字符的区位相同;
计算所述第一位置信息与第二位置信息之间的位置差异;
根据所述位置差异及所述标准打印字符区域,采用图像仿射变换分别在所述N张目标医疗单据图片中构建打印字符区域;
分别在所述N张目标医疗单据图片的所述打印字符区域中确定打印文本行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南星汉数智科技有限公司,未经湖南星汉数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910756077.4/1.html,转载请声明来源钻瓜专利网。