[发明专利]一种医疗检验单的检验项信息自动提取方法在审

专利信息
申请号: 201810022957.4 申请日: 2018-01-10
公开(公告)号: CN108241862A 公开(公告)日: 2018-07-03
发明(设计)人: 王荆正;尚健静 申请(专利权)人: 王荆正
主分类号: G06K9/34 分类号: G06K9/34;G16H30/20;G16H10/40
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 271500 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 连通体 图像采集 预处理 二值图像 化验结果 自动提取 检验项 化验 医疗 二值化处理 提取信息 信息识别 信息提取 医疗检验 灰度化 重叠率 自适应 匹配 摄像机 单据 拍照 搜索 相机 采集 图像 合并
【说明书】:

发明公开了一种医疗检验单的检验项信息自动提取方法,步骤如下:(1)、图像采集:将医疗检验单通过摄像机或者相机进行拍照,完成图像采集;(2)、预处理:将采集到的图像分别通过灰度化和自适应二值化处理为二值图像,并在二值图像上进行连通体搜索,得到所有的连通体信息;然后,根据连通体的宽度和高度滤除过宽或过高的连通体,并将重叠率较高的连通体合并;本发明通过图像采集、预处理、化验项目名称与化验结果的识别和定位、化验项目名称与化验结果的匹配等一系列过程,有效提高提取信息的效率和识别精度,信息识别速度快,方法简单,且适用于比较复杂的医疗检验单据的信息提取。

技术领域

本发明涉及的是字符识别技术领域,具体的说是一种医疗检验单的检验项信息自动提取方法。

背景技术

光学字符识别(OCR)技术作为图像识别领域的一大重要研究热点,主要针对文档图像中各种语言、字体等字符的识别,被广泛应用于各种证件识别、票据识别、标志牌识别、文档分析等人们生活、工作和学习的各个方面。关于OCR技术的研究始于20世纪初,经过近一个世纪的研究发展,OCR技术目前已可支持多种语言、针对多种场景并可结合不同平台进行开发,应用也日趋成熟,国内外有许多投入市场应用的OCR软件如Tesseract OCR、ABBYYFineReader、清华文通和清华紫光OCR、汉王OCR等等。

现有的字符识别方法基本可分为预处理、文本定位与字符分割、特征提取、分类识别及后处理等几大阶段,其识别率比较低,而且难以识别一些比较复杂的医疗检验单据。因此,目前还缺少一种完善的针对医疗检验单的检验项信息自动的提取方法。

发明内容

本发明的目的在于针对现有技术的缺陷和不足,提供一种医疗检验单的检验项信息自动提取方法,通过图像采集、预处理、化验项目名称与化验结果的识别和定位、化验项目名称与化验结果的匹配等一系列过程,有效提高提取信息的效率和识别精度。

为实现上述目的,本发明采用的技术方案是:

一种医疗检验单的检验项信息自动提取方法,步骤如下:

1、图像采集:将医疗检验单通过摄像机或者相机进行拍照,完成图像采集;

2、预处理:将采集到的图像分别通过灰度化和自适应二值化处理为二值图像,并在二值图像上进行连通体搜索,得到所有的连通体信息;然后,根据连通体的宽度和高度滤除过宽或过高的连通体,并将重叠率较高的连通体合并;最后,根据每一连通体在多个方向上的识别可信度进行投票,得到医疗检验单拍照图像的正确定向结果;

3、化验项目名称与化验结果的识别和定位:对每一连通体按英文和数字进行字符识别,将识别可信度较高的连通体保留,并将垂直方向重叠、水平方向距离较近的连通体分别合并为英文数字字符组和汉字字符组;然后,考虑检验结果列有汉字结果的情况,对每一连通体及其可能的组合按汉字进行字符识别,将识别可信度较高的连通体或连通体组合保留,并将垂直方向重叠、水平方向距离较近的字符组合并,生成多个候选检验结果列,以数字结果数量、汉字结果数量、英文结果数量为依据从候选结果中选出可信的结果列;

4、化验项目名称和化验项目结果的匹配:首先,找到水平方向与化验项目名称列和化验结果列均重叠、且其顶部距离化验项目名称列和化验项目结果列顶部最近的连通体A;然后,以连通体A的上边界作为参考线,计算最顶端化验项目名称和化验结果距该参考线的Y方向距离,确定第一个化验项目名称对应的正确化验结果项,再根据第一对匹配结果的位置进行第二对结果的匹配,以此类推;最后,对于一对匹配结果,如果对应的化验项目名称是不匹配的候选项目名称,且化验结果不是数字、也不是匹配的英文关键词或汉字关键词,则认为该匹配结果无效,将位于顶端或底端的无效结果滤除。

采用上述结构后,本发明的有益效果为:本发明通过图像采集、预处理、化验项目名称与化验结果的识别和定位、化验项目名称与化验结果的匹配等一系列过程,有效提高提取信息的效率和识别精度,信息识别速度快,方法简单,且适用于比较复杂的医疗检验单据的信息提取。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王荆正,未经王荆正许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810022957.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top