[发明专利]一种基于数据管理的自动模板文字识别实现系统及方法在审
申请号: | 202211199781.2 | 申请日: | 2022-09-29 |
公开(公告)号: | CN115588206A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 仇恒坦;沈壮志;孙梦璐;潘震;李昊 | 申请(专利权)人: | 浪潮软件股份有限公司 |
主分类号: | G06V30/24 | 分类号: | G06V30/24;G06V30/26;G06F40/186;G06F40/205 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 271000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据管理 自动 模板 文字 识别 实现 系统 方法 | ||
本发明公开了一种基于数据管理的自动模板文字识别实现系统及方法,属于OCR领域;所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块:所述模板定制模块添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;所述任务管理模块接收外部请求的参数与数据;所述模板数据管理模块用于管理模板信息,对模板信息进行编辑处理和业务调配;所述文字识别模块用于管理文字识别引擎,返回初始识别结果;本发明系统通过模板定制、任务管理、模板数据管理、文字识别、文本解析五个模块组成,技术架构清晰,协作开发更方便,任务执行更高效。
技术领域
本发明公开一种基于数据管理的自动模板文字识别实现系统及方法,涉及OCR技术领域。
背景技术
文字识别,亦称光学字符识别(Optical Character Recognition,OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,并以文本的形式返回。具体来说,典型的OCR技术路线分为6大步骤,分别是输入、图像预处理、文本方向矫正、文本区域检测、文本识别、输出,每一个环节都需要算法的密切配合,最终达到理想的识别效果,通常情况下的识别准确率可达到96%以上。由于其方便、快捷、准确的优点,广泛用于各类文字采集相关的场景,如交通场景、票据场景、生活场景、教育场景等。
在OCR的应用场景中,OCR技术往往是实现一项业务最重要的一环。尤其地,在面对复杂的文本信息,识别的文字信息需要进一步分析,OCR识别模式将影响最终的信息提取结果。例如,在数字政府建设中,大量的卡、证、照等需要利用OCR技术进行信息提取,这些材料具有版式多样、信息关键字各不相同,甚至同一卡、证、照也会因版次、地区等差异,导致OCR服务通用性较差,不便推广,最终给服务提供商带来了巨大压力,难以落地实施。
随着技术发展,各大技术服务商和研究机构也提出了可定制化的模板来快速实现OCR功能,以求适用种类繁多的场景应用,解决了部分适用问题。然而,一些特定场景提出了技术服务需要具有易部署、适用性强、快速适配更多场景、便于管理等要求,大量技术方案无法满足实际需求。
故现发明一种基于数据管理的自动模板文字识别实现系统及方法,以解决上述问题。
发明内容
本发明针对现有技术的问题,提供一种基于数据管理的自动模板文字识别实现系统及方法,所采用的技术方案为:一种基于数据管理的自动模板文字识别实现系统,所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块:
所述模板定制模块添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
所述任务管理模块接收外部请求的参数与数据;
所述模板数据管理模块用于管理模板信息,对模板信息进行编辑处理和业务调配;
所述文字识别模块用于管理文字识别引擎,返回初始识别结果
所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块:
信息采集模块:读入图片,标定并填写信息,保存;
信息处理模块:是输入修正信息,保存;
信息提交模块:将全部信息提交数据管理模块。
所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息发送给文字识别模块和文本解析模块,最后将识别结果信息打包返回到请求端;
所述文本解析模块采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息。
一种基于数据管理的自动模板文字识别实现方法,所述的方法具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211199781.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全流程信息配置方法及装置
- 下一篇:一种数据处理方法及装置