[发明专利]基于纸质文档的文本识别方法、系统及计算机介质在审
申请号: | 202011296862.5 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112418204A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王飞;沈华;李青;李鹏飞 | 申请(专利权)人: | 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06T7/13 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 311200 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 纸质 文档 文本 识别 方法 系统 计算机 介质 | ||
本申请实施例中提供了一种基于纸质文档的文本识别方法及系统,获取纸质文档的图像,识别图像中的直线,得到所述图像中的多条直线;根据所述多条直线的位置,进行图像位置纠正,得到修正图像;根据所述修正图像的文本区域,进行文本检测和文本识别,得到文本信息位置以及文本信息;根据所述多条直线的位置,进行直线处理,得到图像中的主线;通过所述图像中的主线,将所述修正图像的文本区域进行划分,并根据所述文本信息位置,将所述文本信息进行位置排序,得到文本识别结果。本申请通过OCR技术的文本检测、文本识别得到一系列带有位置信息的文本信息,最终实现将纸质版文档医学检验报告转化成电子化、结构化检验报告数据。
技术领域
本申请属于文字识别技术领域,具体地,涉及一种基于纸质文档的文本识别方法、系统及计算机介质。
背景技术
目前,医学检验报告是辅助临床诊疗的重要工具之一。2018年,我国医疗机构总诊疗人次数超过83亿人次,每位患者每次就诊都可能产生多张医学检验报告单,而在我国,如此庞大的检验报告数据仍然依赖纸质化形式保存。纸质化的医学检验报告不仅不易保存、检索,容易丢失,而且不利于对患者医学检验结果信息的提取,无法基于检验报告内容进行进一步智能化分析,从而不能为患者提供详细的诊疗建议。
目前,医学检验报告的电子化主要依赖于人工录入,人工录入方法易受主观因素影响,准确率较差,且无法实现实时转换。
光学字符识别(Optical Character Recognition,OCR)是一种常用的实现纸质文档到电子化文档智能转化过程的高效技术,一般包括文本检测、文本识别等步骤。其主要原理是利用大量的文档样本,经过深度学习模型进行自动化学习,生成相应的识别模型文件,从而得到文档图片所包含的具体文本内容。但OCR技术识别得到的是非结构化的一系列带有位置信息的文本字符串,而非卫生机构所需的是结构化数据信息,如医学检验报告单上的患者姓名、性别、检查项目及每个检查项目相应的检查结果等。将这些非结构化的文本字符串转化为所需的便于利用的结构化的数据格式的过程即为信息提取过程。现有的基于OCR识别得到的文本进行信息提取的方法包括人工录入或基于模版匹配。人工录入方法效率与准确率都有限;而模版匹配方法则存在通用性受限的问题,同时由于同样依赖人工选择模版参数而准确率也较为有限。目前尚缺乏一种面向医学检验报告等纸质文档的基于OCR识别得到文本,进行高效信息提取的方法。
发明内容
本发明提出了一种基于纸质文档的文本识别方法、系统及计算机介质,旨在解决目前没有面向医学检验报告等纸质文档进行带位置关系的文本信息识别提取的问题。
根据本申请实施例的第一个方面,提供了一种基于纸质文档的文本识别方法,具体包括以下步骤:
获取纸质文档的图像,识别图像中的直线,得到图像中的多条直线;
根据多条直线的位置,进行图像位置纠正,得到修正图像;
根据修正图像的文本区域,进行文本检测和文本识别,得到文本信息位置以及文本信息;
根据多条直线的位置,进行直线处理,得到图像中的主线;
通过图像中的主线,将修正图像的文本区域进行划分,并根据文本信息位置,将文本信息进行位置排序,得到文本识别结果。
在本申请一些实施方式中,获取纸质文档的图像,识别图像中的直线,得到图像中的多条直线,具体包括:
将图像转换为灰度图像;
根据灰度图像,通过边缘检测算法以及概率Hough线变换,得到图像中的多条直线。
在本申请一些实施方式中,根据修正图像的文本区域,进行文本检测和文本识别之前,还包括:
根据修正图像进行文本区域提取和拼接,得到连续的文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011296862.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种成像设备及发声控制方法
- 下一篇:一种氟碳铈矿的焙烧工艺