[发明专利]基于机器学习识别图纸内图例及文字的方法及系统在审
申请号: | 202010028706.4 | 申请日: | 2020-01-11 |
公开(公告)号: | CN111242024A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 林希;宋楠;谢宏 | 申请(专利权)人: | 北京中科辅龙科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 张朝元 |
地址: | 100193 北京市海淀区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 识别 图纸 图例 文字 方法 系统 | ||
1.一种基于机器学习识别图纸内图例及文字的方法,其特征在于,该方法包括以下步骤:
S1 运用数据集构建包含图例特征的图例训练集与包含文字特征的文字训练集;
S2 运用数据集和卷积神经网络获取识别图例及识别文字的神经网络模型;
S3 采用S2中建立的神经网络模型获取图纸中的图例及文字。
2.根据权利要求1所述的基于机器学习识别图纸内图例及文字的方法,其特征在于,S1数据集构建包含以下步骤:
S1.1 首先扫描纸质图纸,手动标记图纸上的图例区域及图例类型生成图例训练集,手动标记图纸上的文字区域及文字内容生成文字训练集;
S1.2 运用图例模板生成的新图例替换掉已有图纸上的图例,同时将图纸上的文本字体进行随机替换,系统自动标记图纸上的图例区域及图例类型生成图例训练集,系统自动标记图纸上的文字区域及文字内容生成文字训练集,构成新的图纸;
S1.3凭空自动生成训练集:
S1.3.1 纸质图纸与CAD格式的PID图纸数量不足时,可以凭空生成训练集来补充,增加样本多样性,提升准确率;
S1.3.2 运用图例模板生成新图例并在空白图纸上随机摆放,同时在图纸上随机生成文字,构成新的图纸;
S1.3.3 根据自动标记出的图例区域、图例类型,生成图例训练集;
S1.3.4 根据自动标记出的文字区域、文字内容,生成文字训练集。
3.根据权利要求1所述的基于机器学习识别图纸内图例及文字的方法,其特征在于,S2训练神经网络模型包含以下步骤:
S2.1运用图例训练集对识别图例区域的卷积神经网络进行训练,训练出可以识别图例的神经网络模型;
S2.2运用文字训练集对识别文字区域的卷积神经网络进行训练,训练出可以识别文字区域的神经网络模型;
S2.3运用文字训练集对识别文字内容的卷积神经网络进行训练,训练出可以识别文字内容的神经网络模型。
4.根据权利要求1所述的基于机器学习识别图纸内图例及文字的方法,其特征在于,S3图纸识别包含以下步骤:
S3.1 将待识别图纸扫描成图像,DPI 200 或以上;
S3.2 将图像调整成灰度图,图像高度设置为6736像素,宽度按比例设置;
S3.3 获取待识别图纸的参数信息传递给识别图例的模型,识别出图纸内所有仪表图例所在区域和类型;
S3.4 获取待识别图纸的参数信息传递给识别文字的模型,识别出图纸内所有文字所在区域及内容;
S3.5 将不同类型文字的规则翻译成正则表达式,然后文字与不同规则的正则表达式进行匹配,获得匹配成功后的文字分类属性;
S3.6 各图例与各文字之间相互进行重叠测试,并计算重叠区域占文字区域的百分比,当超过一定阈值,则认为该文字是该图例的属性。
5.根据权利要求2所述的基于机器学习识别图纸内图例及文字的方法,其特征在于,
S1.1手动标记训练集包含以下具体步骤:
S1.1.1 收集一定数量纸质的PID图纸;
S1.1.2 扫描图纸并生成图像,DPI 200 或以上;
S1.1.3 将图像调整成灰度图,图像高度设置为6736像素,宽度按比例设置;
S1.1.4 根据图纸图像标记出图例区域、图例类型,生成图例训练集;
S1.1.5 根据图纸图像标记出文字区域、文字内容,生成文字训练集;
S1.2自动标记训练集包含以下具体步骤:
S1.2.1 收集一定数量CAD格式的PID图纸;
S1.2.2 根据CAD格式的PID图纸进行图例区域、图例类型、文字区域、文字内容的手动标记;
S1.2.3 将标准图例作为模板随机生成图例,同时随机替换掉CAD图纸中的图例;
S1.2.4 随机生成中英文文字,随机选择一种字体替换掉CAD图纸中的文字;
S1.2.5 根据自动标记出的图例区域、图例类型,生成图例训练集;
S1.2.6 根据自动标记出的文字区域、文字内容,生成文字训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科辅龙科技股份有限公司,未经北京中科辅龙科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010028706.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种子午线轮胎生产制造工艺
- 下一篇:一种大米加工工艺