[发明专利]基于元路径子图的异质图信息提取方法和装置在审
申请号: | 202110649772.8 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113569906A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 尚家兴;蔡昕均;郑林江;刘大江;王启星;付澍 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 路径 异质图 信息 提取 方法 装置 | ||
本申请提出了一种基于元路径子图的异质图信息提取方法,涉及异质图信息提取技术领域,其中,该方法包括:通过异质属性转换,将异质图包含的节点的属性映射到同一特征空间,生成对应的特征向量;根据元路径类别的不同对异质图进行分解,生成同质子图和异质子图;分别对同质子图和异质子图中节点的特征向量进行卷积,生成目标节点在不同子图中的特征表示;对目标节点在不同子图中的特征表示按照相应的权重进行融合,获取到每个节点的多重语义和多种子图结构。本发明可以很好地捕获同质邻居和异质邻居的结构、语义和属性信息,能够提供更加完善的节点特征表示,能够用于广泛的机器学习和图数据挖掘任务。
技术领域
本申请涉及异质图信息提取技术领域,尤其涉及一种基于元路径子图的异质图信息提取方法和装置。
背景技术
图(Graph)或网络(Network)结构对现实数据提供了更加抽象化的表示,现实生活中大多数的数据都可以规范化为节点之间通过边相互连接的图的形式,比如社交网络、交通网络、蛋白质分子结构以及推荐系统等。深度学习技术近几年得到了突飞猛进的发展,研究人员将深度学习技术拓展到人脸识别、语音识别、机器翻译等研究领域,极大促进了人工智能的发展,相关产品在工业中落地并且在现实生活中得到了广泛的应用。然而大多数的深度学习技术都是针对欧式数据,对于图这类非结构化的数据难以直接应用。因此,设计能够挖掘图结构信息的深度学习模型具有很大的研究意义。
图表示学习(Graph Representation Learning)又称为图嵌入(GraphEmbedding)或者网络嵌入(Network Embedding)旨在将图结构映射到低维的向量空间,便于下游丰富的图数据挖掘任务。近年来,学者们提出了大量的图表示学习模型,比如基于矩阵分解的模型通过对图矩阵(邻接矩阵、拉普拉斯矩阵等)进行分解实现降维的目的,基于随机游走的模型通过定义图上的游走规则进行采样然后利用skip-gram模型生成节点的低维向量表示,基于深度学习的模型(图神经网络模型)将卷积神经网络、循环神经网络等模型应用到图数据中。尽管很多的图表示学习方法已经实现了很高的性能,但是其处理的数据大多数为节点或边类型相同的同质图(Homogeneous Graph)。然而现实世界中很多网络的节点或边具有一定的异质性,例如在学者网络中存在作者、论文、会议等节点类型,在电商网站中用户与商品节点的交互关系可能为点击、收藏、购买等。这种含有多个类型的节点或边的网络结构通常称为异质信息网络(Heterogeneous Information Network)或异质图(Heterogeneous Graph)。异质图中不同类型的节点之间的复杂交互使得其具有更加丰富的语义和结构信息,能够对真实世界的数据进行更好地刻画。
异质图中多类型的节点和关系之间存在复杂的交互,如何精确地提取出不同的语义信息成为研究的难点。现有的研究大多数以元路径为切入点,借助元路径对多类型节点和关系的引导,可以捕捉到异质图中的多重语义表示。目前基于元路径对异质图研究的工作大多数集中于元路径引导的同质子图,对异质节点之间交互的关注度不高。
异质图表示学习的目标是将异质图嵌入到低维的向量空间,由于异质图中节点和边的类型复杂多样,所蕴含的结构和语义信息也更加丰富。Dong等人设计了元路径引导的随机游走来获取不同类型节点交互的序列作为skip-gram模型的输入,然后获取每个节点的向量表示。Fu等人采用了多任务学习的思想同时获取节点和元路径的表示,其首先基于随机游走和负采样方法得到训练数据,然后应用神经网络有监督学习的形式最大化节点对之间的关系,得到节点和元路径的特征向量。Shi等人设计了基于元路径的随机游走方法采样同质节点序列,然后应用DeepWalk学习节点表示。Chen等人基于度量学习捕获异质图的一阶和二阶相似性,通过引入特征关系的投影嵌入矩阵,分别对节点和边在不同的空间进行建模。Zhang等人联合优化异构skip-gram和深度语义编码器,以捕获异构网络中节点的近似性和非结构化的语义关系。Gao等人提出了二分图的表示学习方法,将二分图中的节点按照类型分为两个同质图,并分别进行随机游走采样,利用负采样的方法训练每个节点的向量表示。上述的异质图表示学习模型大多数只针对图的结构,未考虑节点的属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110649772.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置