[发明专利]一种基于PaddleOCR的图像识别模型训练及分析方法在审
申请号: | 202210506508.3 | 申请日: | 2022-05-11 |
公开(公告)号: | CN114821564A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 梁沛森;陈锦锋;钟建琛;李文浩;陈武聪;邓耀隆 | 申请(专利权)人: | 广东金赋科技股份有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/19;G06N20/00 |
代理公司: | 东莞卓为知识产权代理事务所(普通合伙) 44429 | 代理人: | 汤冠萍 |
地址: | 528200 广东省佛山市南海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 paddleocr 图像 识别 模型 训练 分析 方法 | ||
本发明公开一种基于PaddleOCR的图像识别模型训练及分析方法,包括以下步骤:a、外部用户接入深度学习OCR系统;b、深度学习OCR系统获取模型配置,根据外部用户传入的参数配置数据;c、根据类型代码获取配置数据对象列表;d、根据配置数据对象个数,循环调用OCR识别,获取识别结果;e、将识别结果汇总,并筛选出最优结果;f、然后根据需求进行后处理操作;g、最后统一封装返回对象进行返回处理。本发明可广泛用于政务、税务、金融等各个领域,通过统一的标准化接口,实现对政务材料的鉴别、税务票号的识别以及金融银行卡的识别等功能,最终达成产品的AI赋能目标,该方法统一、便捷、高效,无需人工操作。
技术领域
本发明涉及OCR识别技术领域,具体涉及一种基于PaddleOCR的图像识别模型训练及分析方法。
背景技术
近年来计算机视觉技术快速发展,图片文字的OCR识别成为热门方向,目前常规文本识别,自然场景下文本识别,安防领域中的身份证识别,金融领域中票据银行卡识别等背景下的OCR识别研究较多,并且已经有成熟的应用。OCR识别技术的实现主要依赖于深度学习框架,如TensorFlow,caffe和Paddle等框架,在框架中搭建识别的网络模型,通过大量数据对模型进行优化训练,进而实现通过模型识别文字。
已有OCR识别方法针对不同应用场景的兼容性不高,且在需要进行文本校验与信息提取工作时还需人工进行检验与提取工作,人工成本高、效率低下。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于PaddleOCR的图像识别模型训练及分析方法,可实现对政税终端用户、智能柜台用户、互联网用户的OCR识别功能,该方法统一、便捷、高效,无需人工操作。
本发明的技术方案如下:
一种基于PaddleOCR的图像识别模型训练及分析方法,包括以下步骤:
a、外部用户接入深度学习OCR系统;
b、深度学习OCR系统获取模型配置,根据外部用户传入的参数配置数据;
c、根据类型代码获取配置数据对象列表;
d、根据配置数据对象个数,循环调用OCR识别,获取识别结果;
e、将识别结果汇总,并筛选出最优结果;
f、然后根据需求进行后处理操作;
g、最后统一封装返回对象进行返回处理。
所述外部用户包括政税终端用户、智能柜台用户、互联网用户。
步骤a中,深度学习OCR系统通过OCR识别接口接入外部用户。
所述深度学习OCR系统包括Java端和Python端,Java端负责步骤b、步骤c,Python端负责步骤d。
步骤d中,OCR识别调用流程包括以下步骤:
d1、对待训练数据进行数据标注操作;
d2、根据实际情况修改训练配置并开始训练模型;
d3、最后进行模型转换。
相对于现有技术,本发明的有益效果在于:
本发明可广泛用于政务、税务、金融等各个领域,通过统一的标准化接口,实现对政务材料的鉴别、税务票号的识别以及金融银行卡的识别等功能,最终达成产品的AI赋能目标。
本发明可实现对政税终端用户、智能柜台用户、互联网用户的OCR识别功能,该方法统一、便捷、高效,无需人工操作。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东金赋科技股份有限公司,未经广东金赋科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210506508.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序