[发明专利]一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法在审
申请号: | 202211119268.8 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115578741A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 赵卫东;张晓明;李旭健;肖智勇 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V30/416;G06N3/04;G06N3/08;G06V30/146;G06V30/18;G06V30/19;G06V30/20 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 种艳丽 |
地址: | 266590 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于Mask R‑cnn算法和类型分割的扫描文件版面分析方法,属于深度学习领域。该方法主要采用类型分割的技术方案,以Mask R‑cnn算法为基础进行实现,目的是为了提高版面分析的准确率。具体包括如下步骤;将扫描的文件彩色图像作为输入,首先进行表格识别并分割,分割表格后的图像再作为输入,进行插图的识别并分割,然后去除红章,最后对去除表格、插图和红章后的图像进行标题识别,未识别部分作为文本部分输出。在复杂版面的扫描文件中,该方法解决了自顶向下、自底向上和综合型方法的准确率不高的问题,从而对图像分类、文本处理以及OCR等技术能够进一步的优化,最终提高了扫描文件版面分析准确率。 | ||
搜索关键词: | 一种 基于 mask cnn 算法 类型 分割 扫描 文件 版面 分析 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211119268.8/,转载请声明来源钻瓜专利网。
- 上一篇:充电路面与光伏发电路面功能分开的太阳能公路系统
- 下一篇:一种卷线盘绕线设备