首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于深度学习的自由格式文档识别方法在审

申请号：	202011168354.9	申请日：	2020-10-28
公开（公告）号：	CN112348022A	公开（公告）日：	2021-02-09
发明（设计）人：	王文锋;傅启予;韩光祖;秦泽文;邓梁;朱志童	申请（专利权）人：	富邦华一银行有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/00;G06K9/20;G06N3/04;G06N3/08
代理公司：	上海翰信知识产权代理事务所(普通合伙) 31270	代理人：	张维东
地址：	200120 上海市浦东新区自由贸易试验区***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习自由格式文档识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的自由格式文档识别方法，其特征在于，包括以下步骤：

定义模板，所述模板中包含多个矩形碎片的坐标位置；

获取待识别文档；

OCR引擎全文识别，以判断所述待识别文档所属模板；

调用所述模板中所有矩形碎片的坐标位置，采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中；

根据所述矩形碎片及其坐标位置切割所述待识别文档，形成多个碎片文件；

将所述多个碎片文件存入数据库，并将所述多个碎片文件传入消息队列中；

OCR引擎继续识别消息队列中的碎片文件，得到识别结果；

返回所述碎片文件和识别结果到数据库；

完成识别。

2.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，各碎片文件均具有各自的UUID。

3.如权利要求2所述的基于深度学习的自由格式文档识别方法，其特征在于，所述碎片文件包括：UUID、命名、坐标位置、编号以及识别引擎。

4.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，OCR引擎继续识别消息队列中的碎片文件的过程中，采用RCNN模型进行图片文本识别，得到识别结果。

5.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，所述模板包括：证件类模板、申请书类模板、审批类模板和报表类模板；

各类模板中包括多种模板。

6.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，定义模板包括以下步骤：

上传具有模板的图片；

定义模板的名称；

在所述图片中画出所有的矩形碎片，并显示所有矩形碎片的坐标位置；

选择各所述矩形碎片的识别引擎；

填写各所述矩形碎片的标签；

完成模板定义。

7.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，在获取待识别文档之后，OCR引擎全文识别之前，还包括以下步骤：

主动选择对应模板。

8.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，在OCR引擎全文识别之后，调用所述模板中所有的坐标位置之前，还包括以下步骤：

对所述待识别文档进行预处理；

所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。

9.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，所述待识别文档包括：单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。

10.如权利要求1所述的基于深度学习的自由格式文档识别方法，其特征在于，若所述待识别文档不能归属于现有模板中任意一个模板，则不对所述待识别文档进行处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于富邦华一银行有限公司，未经富邦华一银行有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011168354.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种食品级果蔬消毒片剂及其制备方法
下一篇：一种支持自动预警的信贷资信管理系统

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top