[发明专利]一种知识和数据混合驱动的工业数据对齐方法在审

专利信息
申请号: 202210171766.0 申请日: 2022-02-24
公开(公告)号: CN114611587A 公开(公告)日: 2022-06-10
发明(设计)人: 王都;赵晓亮;史远;王壬欢;彭浩 申请(专利权)人: 石家庄铁大科贤信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08
代理公司: 成都帝鹏知识产权代理事务所(普通合伙) 51265 代理人: 李华
地址: 050000 河北省石家庄*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识 数据 混合 驱动 工业 对齐 方法
【说明书】:

发明公开一种知识和数据混合驱动的工业数据对齐方法,包括采集工业数据;利用采集的工业数据设置元路径构建异构网络,针对构建的异构网络构建多视图,利用多视图嵌入生成节点嵌入表示;为每个元路径赋予权重,并融合节点嵌入表示;结合由知识牵引的工业数据表征,利用对比学习来学习节点序列的相似性,完成对齐。克服了上述主流异构网络对齐技术的主要缺陷,本发明提供的技术方案降低了噪声数据所带来的的影响,避免人工设定元路径带来的错误传递;通过运用图表示学习和对比学习结合将工业中用到的传感器产生的温度等监控数据与工业信息系统中的数据对齐,有效的解决了工业数据不规整的问题。

技术领域

本发明属于工业数据处理技术领域,特别是涉及一种知识和数据混合驱动的工业数据对齐方法。

背景技术

随着智能制造的发展,自动化、信息化、智能化等技术渗透到制造业生产过程的各个环节,从工业现场的传感器、设备到制造生产过程中的各个信息系统(如制造执行管理系统、生产监控系统、设备运行维护系统、产品质量检测系统、能耗管理系统等),均会产生大量不同结构类型的数据。数据之间的关系也日渐紧密,呈现出数据与数据之间相互关联和交叉的局面。数据的增长对应就产生了大量的多源异构数据,要想利用这些数据推动工业的发展,工业异构数据对齐技术的研究迫在眉睫。而工业数据包括多种传感器产生的数据和分散在各种各样的信息系统中的数据,包括常见的SCADA系统、振动状态监测的CMS系统,辅助运维工作的ERP系统等,不同的数据来源造成了工业数据不如互联网场景中的数据规整。在传感器、控制器及其他外接系统等不同信息系统中采集到的数据,都需要进行数据对齐与整合。

目前处理异构网络数据对齐的主流技术包括:将节点属性信息作为匹配依据、将节点间的关系结构作为节点对齐特征和通过网络表示学习方法得到节点表征并建立节点匹配策略。

基于网络表示学习的网络对齐模型可分为有监督模型和无监督模型。监督模型,虽然不依赖于节点的属性特征,通常以锚节点(即事先已知的匹配节点集)为线索,建立机器学习模型得到节点表征。然而,事先已知的锚节点数量往往非常少,甚至几乎没有,只对一些存在锚节点的图有效;对于工业大数据这样的数据源,既不规则也不整齐的数据并不适用。近年来,一些无监督的方法被提出,在没有任何先验知识的情况下建立网络节点的表达,主要有基于机器学习和基于矩阵分解的两种方法。其中基于矩阵分解的方法,其特征设定的局限性和随机抽样策略所选取地标节点的代表性在一定程度上影响了算法性能。面对异构网络对齐的一些问题,上述主流的异构网络对齐方法,在某一特定问题上都做出了比较好的改进效果,但都存在一定的问题。

基于属性对齐方法,依赖于节点的属性特征,出于隐私保护等考虑,用户名及其他重要节点属性特征对齐属性经常缺失或具有伪装、虚假等性质,误导判断。因此,这种依靠节点属性特征的方法对异构网络对齐问题解决有局限性。

基于节点间关系结构进行对齐的前提是节点间必须存在某种关系,才能找到关联,适用范围相对较窄。并且该方法面临一个严重挑战,即网络结构对噪声和结构变化非常敏感。而工业现场环境恶劣,数据质量差同样也是源于工业场景中的一个特例,由于环境恶劣,采集出来的数据包含大量环境噪声,出现诸多数据异常点,会对网络结构造成严重后果。当网络结构发生细微变化时,节点对齐的性能往往会下降。

异构图的嵌入主要关注基于元路径的结构信息。ESim虽然考虑的多条元路径的信息,但是在面对具体问题时,无法学习到最优的权重组合。Meta-path2vec通过随机游走和skip-gram算法来做嵌入,但是其只考虑了一条元路径;HERec也是只考虑单条元路径,通过限制策略来过滤节点序列做嵌入。HIN2Vec使用了同时训练节点和元路径的方法。PME通过欧几里德距离来保留节点的邻接区域。HEER则是通过边表示来做异构图的嵌入。Meta-graph2vec最大限度保留了结构和语义信息。还有基于meta-graph的嵌入模型,同时考虑了一个meta-graph的所有元信息的隐藏关系。但是这些方法仍然无法实现异构网络的有效对齐,在过程中无法克服所产生的影响和错误,尤其是在面临工业传感数据对于异构结构的负责和特殊性,无法解决工业数据不规整的问题。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁大科贤信息技术有限公司,未经石家庄铁大科贤信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210171766.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top