[发明专利]一种基于深度学习的自由格式文档识别方法在审
申请号: | 202011168354.9 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112348022A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 王文锋;傅启予;韩光祖;秦泽文;邓梁;朱志童 | 申请(专利权)人: | 富邦华一银行有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/00;G06K9/20;G06N3/04;G06N3/08 |
代理公司: | 上海翰信知识产权代理事务所(普通合伙) 31270 | 代理人: | 张维东 |
地址: | 200120 上海市浦东新区自由贸易试验区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 自由 格式 文档 识别 方法 | ||
1.一种基于深度学习的自由格式文档识别方法,其特征在于,包括以下步骤:
定义模板,所述模板中包含多个矩形碎片的坐标位置;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;
返回所述碎片文件和识别结果到数据库;
完成识别。
2.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,各碎片文件均具有各自的UUID。
3.如权利要求2所述的基于深度学习的自由格式文档识别方法,其特征在于,所述碎片文件包括:UUID、命名、坐标位置、编号以及识别引擎。
4.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,OCR引擎继续识别消息队列中的碎片文件的过程中,采用RCNN模型进行图片文本识别,得到识别结果。
5.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;
各类模板中包括多种模板。
6.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,并显示所有矩形碎片的坐标位置;
选择各所述矩形碎片的识别引擎;
填写各所述矩形碎片的标签;
完成模板定义。
7.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:
主动选择对应模板。
8.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。
9.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
10.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富邦华一银行有限公司,未经富邦华一银行有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011168354.9/1.html,转载请声明来源钻瓜专利网。