[发明专利]一种节点嵌入表示方法和装置在审
申请号: | 201811133771.2 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109325152A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 杨慧萍;郑凯;段立新;江建军 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 选定节点 节点序列 方法和装置 关联节点 嵌入 连接关系 特征向量 转移概率 图结构 向量 申请 | ||
本申请提供了一种节点嵌入表示方法和装置,该方法包括:基于图结构中节点之间的连接关系以及转移概率,生成节点序列;基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。
技术领域
本申请涉及数据分析技术领域,具体而言,涉及一种节点嵌入表示方法和装置。
背景技术
图结构是一种直观可见的结构,同时图结构能够充分反映数据之间的真实依赖关系。通过对图结构进行特征学习,实现节点、边的嵌入表示,能够挖掘图结构所体现的数据之间的关系。
现有对图结构的特征向量学习方法通过随机游走从图结构中得到节点序列,再通过模型训练,得到节点的表示向量。这种方法忽略了节点序列中节点的先后顺序,例如,没有充分挖掘图结构中节点之间的转移概率信息或拓扑结构,使得现有特征向量学习方法得到的节点的特征向量不能充分反映图结构中所蕴含的信息,降低了图结构在应用场景中的准确度。
发明内容
有鉴于此,本申请的目的在于提供一种节点嵌入表示方法和装置,能够使得得到的表示向量更加准确,提高节点表示向量在应用中的准确度。
第一方面,本申请实施例提供了一种节点嵌入表示方法,该方法包括:
基于图结构中节点之间的连接关系以及转移概率,生成节点序列;
基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;
针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。
可选地,所述基于图结构中节点之间的连接关系以及转移概率,生成节点序列,包括:
基于所述节点之间的连接关系以及所述转移概率,遍历所述图结构,生成所述节点序列。
可选地,所述基于图结构中节点之间的连接关系以及转移概率,生成节点序列,包括:
基于所述节点之间的连接关系,确定节点之间的转移偏置概率,使用所述转移偏置概率,更新所述节点之间的转移概率;
基于所述节点之间的连接关系以及更新后的节点之间的转移概率,遍历所述图结构,生成所述节点序列。
可选地,所述基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列,包括:
从所述节点序列中,选取包含所述选定节点的设定长度的节点子序列;
将所述节点子序列中去除所述选定节点之后的序列作为所述选定节点的关联节点序列。
可选地,所述基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列,包括:
在所述节点序列中,将位于所述选定节点前、后的预设长度的节点子序列,确定为所述选定节点的关联节点序列。
第二方面,本申请实施例提供了一种节点嵌入表示装置,该装置包括:
生成模块,用于基于图结构中节点之间的连接关系以及转移概率,生成节点序列;
确定模块,用于基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;
计算模块,用于针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。
可选地,所述生成模块具体用于:
基于所述节点之间的连接关系以及所述转移概率,遍历所述图结构,生成所述节点序列。
可选地,所述生成模块具体用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811133771.2/2.html,转载请声明来源钻瓜专利网。