[发明专利]一种用于电气图纸智能识别的数据预处理方法及系统在审
申请号: | 201911206281.5 | 申请日: | 2019-11-29 |
公开(公告)号: | CN111027429A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 陈韬文 | 申请(专利权)人: | 陈韬文 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 何文聪 |
地址: | 510006 广东省广州市番禺区小谷围*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 电气 图纸 智能 识别 数据 预处理 方法 系统 | ||
1.一种用于电气图纸智能识别的数据预处理方法,其特征在于,包括以下步骤:
对电气图纸的文本进行第一预处理,得到处理后的文本数据;
对电气图纸的圆弧进行第二预处理,得到处理后的圆弧数据;
对电气图纸的直线进行第三预处理,得到处理后的直线数据;
对电气图纸的圆和椭圆进行第四预处理,得到处理后的圆和椭圆数据;
对电气图纸的图签进行过滤处理,得到处理后的图签数据。
2.根据权利要求1所述的一种用于电气图纸智能识别的数据预处理方法,其特征在于:所述对电气图纸的文本进行第一预处理,得到处理后的文本数据这一步骤,包括以下步骤:
获取电气图纸的文本高度,并处理得到第一文本阈值和第二文本阈值,过滤掉文本高度大于第一文本阈值或小于第二文本阈值的文本;
使用正则表达式过滤所述电气图纸的文本;
对所述过滤后的文本进行拼接合并;
用分隔符将所述过滤后的文本分隔。
3.根据权利要求1所述的一种用于电气图纸智能识别的数据预处理方法,其特征在于:所述对电气图纸的圆弧进行第二预处理,得到处理后的圆弧数据这一步骤,包括以下步骤:
根据圆弧的起始角度,将圆弧处理为圆;
将多条半径一致且形成闭环的圆弧处理为圆;
删除对两条所述直线起连接作用的圆弧,所述直线包括两条横线或竖线。
4.根据权利要求1所述的一种用于电气图纸智能识别的数据预处理方法,其特征在于:所述对电气图纸的直线进行第三预处理,得到处理后的直线数据这一步骤,包括以下步骤:
将所述直线绘制为灰度图,通过对灰度图的直线检测,得到处理后的直线数据;
删除所述电气图纸中含有的网格线;
删除所述电气图纸中含有的表格线。
5.根据权利要求1所述的一种用于电气图纸智能识别的数据预处理方法,其特征在于:所述对电气图纸的圆和椭圆进行第四预处理,得到处理后的圆和椭圆数据这一步骤,包括以下步骤:
获取电气图纸的直线及文本,通过处理直线得到第一圆阈值和第二圆阈值,过滤半径不处于所述阈值之间的圆和椭圆;
删除所述电气图纸中在直线交接点上的圆和椭圆。
6.根据权利要求1所述的一种用于电气图纸智能识别的数据预处理方法,其特征在于:所述对电气图纸的图签进行过滤处理,得到处理后的图签数据这一步骤,包括以下步骤:
按照横坐标对所述电气图纸中的直线分类,并得到横坐标距离阈值;
对所述分类直线进行分析,根据横坐标距离阈值获得异常的直线类;
按照纵坐标对所述电气图纸中的直线分类,并得到纵坐标距离阈值;
对所述分类直线进行分析,根据纵坐标距离阈值获得异常的直线类。
7.根据权利要求6所述的一种用于电气图纸智能识别的数据预处理方法,其特征在于:所述对电气图纸的图签进行过滤处理,得到处理后的图签数据这一步骤,还包括以下步骤:
对于所述异常的直线类,删除中心坐标位置在预设范围内的直线。
8.一种用于电气图纸智能识别的数据预处理系统,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7中任一项所述的一种用于电气图纸智能识别的数据预处理方法。
9.一种用于电气图纸智能识别的数据预处理系统,其特征在于,包括:
文本预处理模块,用于对电气图纸的文本进行预处理,得到处理后的文本数据;
圆弧预处理模块,用于对电气图纸的圆弧进行预处理,得到处理后的圆弧数据;
直线预处理模块,用于对电气图纸的直线进行预处理,得到处理后的直线数据;
圆和椭圆预处理模块,用于对电气图纸的圆和椭圆进行预处理,得到处理后的圆和椭圆数据;
图签预处理模块,用于对电气图纸的图签进行过滤处理,得到处理后的图签数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈韬文,未经陈韬文许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911206281.5/1.html,转载请声明来源钻瓜专利网。