[发明专利]PDF图纸文字识别方法、系统以及设备在审

申请号：	202010278085.5	申请日：	2020-04-10
公开（公告）号：	CN111401312A	公开（公告）日：	2020-07-10
发明（设计）人：	张东锋;曾雏鹏;李俊波	申请（专利权）人：	深圳新致软件有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06N3/04
代理公司：	上海正策律师事务所 31271	代理人：	李丽;张晟
地址：	518***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	pdf 图纸文字识别方法系统以及设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种PDF图纸文字识别方法、系统以及设备，该PDF图纸文字识别方法包括以下步骤：基于深度学习执行光学字符识别步骤；定制化识别和通用识别步骤；以及移动设备低质量图像识别步骤；其中，该基于深度学习执行光学字符识别步骤包括步骤：检测场景中有文字的区域并对区域中的文字进行识别，其中基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中基于CNN、CRNN算法进行文字的识别；其中，该定制化识别步骤包括以下步骤：根据PDF中表格文字或者PDF中框架内容识别PDF图纸类型；根据结构化特征提取区域内的内容；以及提取关键区域，通过深度神经网络识别区域中的文字或提取关键文字。

技术领域

本发明涉及图像处理领域，尤其涉及一种PDF图纸文字识别方法、系统以及设备。

背景技术

人工智能在数据、算法和计算能力方面取得了飞速发展，在全球经济数字化转型的大背景下迎来了新一轮的发展浪。此次人工智能浪潮的影响力远超之前，其中最显著的特点是影响力从专业领域扩散到了大众化领域。

PDF高精度识别作为当今市场颇为成熟的技术，基于传统OCR和深度学习的方法也应用于各行各业。银行票据的识别、PDF表格识别和工业图纸识别都是已经被应用广泛且成熟的技术。针对格式化、模板化的PDF的识别在精度上和速度上都取得了令人瞩目的成效，从而提高了各行业从业人员的工作效率和能力。

传统的PDF识别基本固定形式的PDF，对PDF质量有一定要求。而随着智能手机的普及，对于个人手机拍摄的低质量PDF图像，传统方法并没有很好的解决方案。

而当下大多数PDF识别都是整张识别，并没有提供针对特殊区域的提取和识别。针对一些结构化的PDF图纸，提取用户感兴趣的区域(POI)并解析其中的内容也是本方案的一个特色。

发明内容

本发明的目的在于提供一种PDF图纸文字识别方法、系统以及设备，提供了定制化和通用场景等多种识别方案，并且基于深度学习最近的OCR算法和相应的图像处理技术，能提供用户识别低质量图像的解决方案。

本发明的另一目的在于提供一种PDF图纸文字识别方法、系统以及设备，能够针对工业图纸、票据、个人设备拍摄图像等各类场景的识别，并解决不同用户的不同需求。

为了实现上述至少一个发明目的，本发明提供了一种PDF图纸文字识别方法，所述PDF图纸文字识别方法包括以下步骤：

基于深度学习执行光学字符识别步骤；定制化识别和通用识别步骤；以及移动设备低质量图像识别步骤；

其中，所述基于深度学习执行光学字符识别步骤包括步骤：检测场景中有文字的区域并对区域中的文字进行识别，其中基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中基于CNN、CRNN算法进行文字的识别；

其中，所述定制化识别步骤包括以下步骤：根据PDF中表格文字或者PDF中框架内容识别PDF图纸类型；根据结构化特征提取区域内的内容；以及提取关键区域，通过深度神经网络识别区域中的文字或提取关键文字。

在一些实施例中，其中所述定制化识别步骤的所述提取关键区域步骤还包括以下步骤：

根据POI比例大小提取关键区域；

利用霍夫变换、角点检测提取所有框架；

根据文字的模糊匹配和精确匹配提取关键区域；

根据区域的边缘特性提取关键区域；以及

根据区域中文字特性提取关键区域。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳新致软件有限公司，未经深圳新致软件有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010278085.5/2.html，转载请声明来源钻瓜专利网。

上一篇：一种余热锅炉受热面吊挂防磨装置
下一篇：一种铝型材喷涂前处理液及喷涂前处理方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]PDF图纸文字识别方法、系统以及设备在审

专利文献下载