[发明专利]一种知识和数据混合驱动的工业数据对齐方法在审
申请号: | 202210171766.0 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114611587A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 王都;赵晓亮;史远;王壬欢;彭浩 | 申请(专利权)人: | 石家庄铁大科贤信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 成都帝鹏知识产权代理事务所(普通合伙) 51265 | 代理人: | 李华 |
地址: | 050000 河北省石家庄*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 数据 混合 驱动 工业 对齐 方法 | ||
本发明公开一种知识和数据混合驱动的工业数据对齐方法,包括采集工业数据;利用采集的工业数据设置元路径构建异构网络,针对构建的异构网络构建多视图,利用多视图嵌入生成节点嵌入表示;为每个元路径赋予权重,并融合节点嵌入表示;结合由知识牵引的工业数据表征,利用对比学习来学习节点序列的相似性,完成对齐。克服了上述主流异构网络对齐技术的主要缺陷,本发明提供的技术方案降低了噪声数据所带来的的影响,避免人工设定元路径带来的错误传递;通过运用图表示学习和对比学习结合将工业中用到的传感器产生的温度等监控数据与工业信息系统中的数据对齐,有效的解决了工业数据不规整的问题。
技术领域
本发明属于工业数据处理技术领域,特别是涉及一种知识和数据混合驱动的工业数据对齐方法。
背景技术
随着智能制造的发展,自动化、信息化、智能化等技术渗透到制造业生产过程的各个环节,从工业现场的传感器、设备到制造生产过程中的各个信息系统(如制造执行管理系统、生产监控系统、设备运行维护系统、产品质量检测系统、能耗管理系统等),均会产生大量不同结构类型的数据。数据之间的关系也日渐紧密,呈现出数据与数据之间相互关联和交叉的局面。数据的增长对应就产生了大量的多源异构数据,要想利用这些数据推动工业的发展,工业异构数据对齐技术的研究迫在眉睫。而工业数据包括多种传感器产生的数据和分散在各种各样的信息系统中的数据,包括常见的SCADA系统、振动状态监测的CMS系统,辅助运维工作的ERP系统等,不同的数据来源造成了工业数据不如互联网场景中的数据规整。在传感器、控制器及其他外接系统等不同信息系统中采集到的数据,都需要进行数据对齐与整合。
目前处理异构网络数据对齐的主流技术包括:将节点属性信息作为匹配依据、将节点间的关系结构作为节点对齐特征和通过网络表示学习方法得到节点表征并建立节点匹配策略。
基于网络表示学习的网络对齐模型可分为有监督模型和无监督模型。监督模型,虽然不依赖于节点的属性特征,通常以锚节点(即事先已知的匹配节点集)为线索,建立机器学习模型得到节点表征。然而,事先已知的锚节点数量往往非常少,甚至几乎没有,只对一些存在锚节点的图有效;对于工业大数据这样的数据源,既不规则也不整齐的数据并不适用。近年来,一些无监督的方法被提出,在没有任何先验知识的情况下建立网络节点的表达,主要有基于机器学习和基于矩阵分解的两种方法。其中基于矩阵分解的方法,其特征设定的局限性和随机抽样策略所选取地标节点的代表性在一定程度上影响了算法性能。面对异构网络对齐的一些问题,上述主流的异构网络对齐方法,在某一特定问题上都做出了比较好的改进效果,但都存在一定的问题。
基于属性对齐方法,依赖于节点的属性特征,出于隐私保护等考虑,用户名及其他重要节点属性特征对齐属性经常缺失或具有伪装、虚假等性质,误导判断。因此,这种依靠节点属性特征的方法对异构网络对齐问题解决有局限性。
基于节点间关系结构进行对齐的前提是节点间必须存在某种关系,才能找到关联,适用范围相对较窄。并且该方法面临一个严重挑战,即网络结构对噪声和结构变化非常敏感。而工业现场环境恶劣,数据质量差同样也是源于工业场景中的一个特例,由于环境恶劣,采集出来的数据包含大量环境噪声,出现诸多数据异常点,会对网络结构造成严重后果。当网络结构发生细微变化时,节点对齐的性能往往会下降。
异构图的嵌入主要关注基于元路径的结构信息。ESim虽然考虑的多条元路径的信息,但是在面对具体问题时,无法学习到最优的权重组合。Meta-path2vec通过随机游走和skip-gram算法来做嵌入,但是其只考虑了一条元路径;HERec也是只考虑单条元路径,通过限制策略来过滤节点序列做嵌入。HIN2Vec使用了同时训练节点和元路径的方法。PME通过欧几里德距离来保留节点的邻接区域。HEER则是通过边表示来做异构图的嵌入。Meta-graph2vec最大限度保留了结构和语义信息。还有基于meta-graph的嵌入模型,同时考虑了一个meta-graph的所有元信息的隐藏关系。但是这些方法仍然无法实现异构网络的有效对齐,在过程中无法克服所产生的影响和错误,尤其是在面临工业传感数据对于异构结构的负责和特殊性,无法解决工业数据不规整的问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁大科贤信息技术有限公司,未经石家庄铁大科贤信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210171766.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置