[发明专利]用于从P&ID提取机器可读信息的技术在审

专利信息
申请号: 202110125008.0 申请日: 2021-01-29
公开(公告)号: CN114078253A 公开(公告)日: 2022-02-22
发明(设计)人: K-A·耶哈;M-A·加德纳 申请(专利权)人: 本特利系统有限公司
主分类号: G06V30/412 分类号: G06V30/412;G06V30/19;G06V30/24;G06N3/04;G06N3/08
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 李湘;陈岚
地址: 美国宾夕*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 id 提取 机器 可读 信息 技术
【说明书】:

在示例实施例中,提供了用于使用机器学习来提取对于以仅图像格式的P&ID中的文本框和符号的机器可读标记的技术。P&ID数据提取应用使用光学字符识别(OCR)算法来预测对于P&ID中文本框的标记。P&ID数据提取应用使用第一机器学习算法来检测P&ID中的符号,并针对每个符号返回预测边界框和装备的预测种类。可以通过非极大值抑制来抽取预测边界框中的一个或多个,以避免重叠检测。P&ID数据提取应用使用第二机器学习算法来推断具有剩余预测边界框的每个检测到的符号的属性。P&ID数据提取应用以机器可读格式存储预测边界框和包括装备的预测种类和推断属性的标记。

技术领域

本公开总体上涉及管道和仪表图(P&ID)在工厂和基础设施项目中的使用,并且更具体地涉及用于从以仅图像格式的P&ID提取机器可读信息的技术。

背景技术

许多工程领域利用功能图。与表示元素的特定位置、大小和形状的物理模型相比之下,功能图与位置、大小和形状无关,而是聚焦于工艺流程。在工厂和基础设施设计和维护的领域,常见类型的功能图是P&ID。图1是示例P&ID 100的一部分的视图。P&ID包括表示元件(例如,阀、泵、容器、仪器等)的符号110、提供元件的描述(例如,名称、代码、属性等)的文本框120、表示元件之间的连接(例如,管道、电线等)的连接130、以及其他信息(例如,标题框、图例、注释等)(未显示)。

典型的工厂或基础设施项目可能具有数百个在多年的过程中已经创建的相关P&ID。这些P&ID通常可能以缺少关于符号、文本框和其中表示的连接的机器可读信息(例如,元数据)的仅图像格式(例如,作为诸如JPG或PNG的图形文件,或作为仅图像PDF等)可得。有时仅图像P&ID源自打印文档的扫描,并且质量差、具有低分辨率、视觉伪影、不清晰或模糊的部分等。

在仅图像格式中,P&ID中的信息难以验证且难以使用。越来越期望创建工厂和基础设施的数字孪生,并且P&ID中的信息通常在创建此类模型时有用。然而,由于以仅图像格式的信息在很大程度上对于设计和建模应用是不可访问的,因此获得此类信息通常涉及冗长的手动检查和数据输入。在仅图像格式的情况下,甚至更新P&ID本身都是困难的。

解决以仅图像格式的P&ID的问题的一种可能方法是在设计应用中手动重新创建每个P&ID。人类操作人员查看仅图像P&ID,并使用由设计应用提供的工具手动重新创建他或她看到的每个文本框、符号、连接等。结果是新的P&ID,其包括描述文本框、符号和连接等的机器可读信息。取决于P&ID的复杂性,手动重新创建可能花费数小时或数十小时,从而致使其在许多用例中是不切实际的。此外,手动重新创建由于其详细但重复的特性固有地易于出错特性。可能需要大量额外的时间和努力来核查和验证手动重新创建的P&ID,以确保可接受的准确度水平。

解决以仅图像格式的P&ID的问题的另一种可能方法是尝试使用图案识别算法来确定每个P&ID中的信息。图案识别算法可以在P&ID中搜索来自图像库的一组剪辑图像的精确(逐像素相同)副本。在找到精确副本时,可以将与图像库中的剪辑图像相关联的信息与精确副本相关联。尽管理论上这种方法可以为以仅图像格式的P&ID构建一组机器可读信息,但在实践中该方法在很大程度上是不可行的。为了成功操作,图案识别算法需要与P&ID中的所有内容相同的剪辑图像的库。由于P&ID通常包含如何表示文本框、符号、连接等的变化,因此在实践中可能需要为每个P&ID或几乎每个P&ID定制创建新的图像库。此外,当P&ID具有低分辨率、包括视觉伪影、具有不清晰或模糊的部分或者以其他方式具有低质量时,图案识别算法可能容易混淆。在这种情况下,理想地应该相等地匹配的图像可能在实践中并不相等地匹配,这可能导致漏掉的识别。

因此,存在对用于从以仅图像格式的P&ID提取机器可读信息的改进技术的需要。

发明内容

在各种实施例中,提供了用于使用机器学习来提取对于以仅图像格式(例如,JPG、PNG、仅图像PDF等)的P&ID中的文本框和符号的机器可读标记的技术。用相应的置信度水平预测每个标记中的信息。机器学习算法被适配和扩展以解决由P&ID提出的挑战。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于本特利系统有限公司,未经本特利系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110125008.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top