[发明专利]一种全卷积神经网络的图纸版面分析与文字识别方法有效
申请号: | 201810679339.7 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109117713B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 朱全银;许梦杰;冯万利;高尚兵;周泓;范家宽;潘阳 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
地址: | 223005 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种全卷积神经网络的图纸版面分析与文字识别方法,首先通过使用图像灰度化、二值化、腐蚀与膨胀和连通域检测等方法对图像进行预处理,然后使用阈值分割进行结果后处理以检测出图像文字区域,接着使用灰度图投影法以及阈值分割来进行文字区域的行切分,最后使用全卷积神经网络文字识别模型进行文字识别。本发明公开的文字识别模型的识别率可以达到90%‑94%,正确率优于传统的单字识别模型,识别速度优于CRNN文字识别模型。本发明方法有效的改进了面向建筑图纸的版面识别和文字识别算法,使得专家审查图纸的效率提高,并增加了建筑图纸的使用价值。 | ||
搜索关键词: | 一种 卷积 神经网络 图纸 版面 分析 文字 识别 方法 | ||
【主权项】:
1.一种全卷积神经网络的图纸版面分析与文字识别方法,其特征在于,所述方法包括:(1)定义图纸图像为image,对image进行缩放、滤波、二值化、腐蚀与膨胀、连通域检测以及阈值过滤来进行文字区域切分,得到文字区域图像集result_boxes={box_image1,box_image2,...}中,其中box_image={box_x,box_y,box_width,box_height};(2)定义循环变量box_image用来遍历result_boxes,对box_image进行灰度图投影来进行文字区域行切分,得到行切分结果集result_lines={line_image1,line_image2,...},其中line_image={line_x,line_y,line_width,line_height};(3)定义循环变量line_image用来遍历result_boxes,对line_image使用基于全卷积神经网络的文字识别模型进行文字识别并将结果整合为文字结果集result_word_arr={line1,line2,...},其中的line={word1,word2,...},其中word为字符。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810679339.7/,转载请声明来源钻瓜专利网。