[发明专利]随机游走、基于分布式系统的随机游走方法、装置以及设备在审
申请号: | 201711061117.0 | 申请日: | 2017-11-02 |
公开(公告)号: | CN108021610A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | 曹绍升;杨新星;周俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 杨移 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机 游走 基于 分布式 系统 方法 装置 以及 设备 | ||
本说明书实施例公开了随机游走、基于分布式系统的随机游走方法、装置以及设备,方案包括:获取根据图数据包含的各节点的信息生成的结构体数组,结构体数组中的结构体包含对应节点的标识,以及该对应节点的相邻节点的标识,进而根据结构体数组,生成随机序列,从而实现在图数据中的随机游走。
技术领域
本说明书涉及计算机软件技术领域,尤其涉及随机游走、基于分布式系统的随机游走方法、装置以及设备。
背景技术
随着计算机和互联网技术的迅速发展,很多业务都可以在网上进行,图计算是处理社交方面的网上业务的一种常用手段。
例如,对于社交风控业务中的账户欺诈识别:每个用户分别作为一个节点,若两个用户之间存在转账关系,则对应的两个节点之间存在一条边,边可以是无向的,也可以是根据转账方向定义了方向的;以此类推,可以得到包含多个节点和多条边的图数据,进而基于图数据进行图计算以实现风控。
随机游走算法是图计算中比较基础和重要的一环,其为上层复杂算法提供支持。在现有技术中,一般采用这样的随机游走算法:在数据库中随机读取图数据包含的一个节点,再继续在该数据库中随机读取该节点的一个相邻节点,以此类推,实现在图数据中的随机游走。
基于现有技术,需要能够应用于大规模图数据的更为高效的随机游走方案。
发明内容
本说明书实施例提供随机游走、基于分布式系统的随机游走方法、装置以及设备,用以解决如下技术问题:需要能够应用于大规模图数据的更为高效的随机游走方案。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种基于分布式系统的随机游走方法,所述分布式系统包括多个机器,所述方法包括:
所述机器获取根据图数据包含的各节点的信息生成的结构体数组,所述结构体数组中的结构体包含对应节点的标识,以及所述对应节点的相邻节点的标识;
根据所述结构体数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种随机游走方法,包括:
根据图数据包含的各节点的信息,生成结构体数组,所述结构体数组中的结构体包含对应节点的标识,以及所述对应节点的相邻节点的标识;
根据所述结构体数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的另一种随机游走方法,包括:
根据图数据包含的各节点的信息,生成由指定数据结构的实例作为元素的元素集合,所述实例包含对应节点的标识,以及所述对应节点的相邻节点的标识;
根据所述元素集合,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种基于分布式系统的随机游走装置,所述分布式系统包括多个机器,所述装置位于所述机器,包括:
获取模块,获取根据图数据包含的各节点的信息生成的结构体数组,所述结构体数组中的结构体包含对应节点的标识,以及所述对应节点的相邻节点的标识;
生成模块,根据所述结构体数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种随机游走装置,包括:
第一生成模块,根据图数据包含的各节点的信息,生成结构体数组,所述结构体数组中的结构体包含对应节点的标识,以及所述对应节点的相邻节点的标识;
第二生成模块,根据所述结构体数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711061117.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人物性格分析方法、装置及存储介质
- 下一篇:传感器和方法