[发明专利]一种重启式随机游走的新型网络嵌入学习方法在审

专利信息
申请号: 201910113316.4 申请日: 2019-02-13
公开(公告)号: CN109919198A 公开(公告)日: 2019-06-21
发明(设计)人: 李建欣;何雨;彭浩;张帅;胡春明 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京中创阳光知识产权代理有限责任公司 11003 代理人: 尹振启
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 随机游走 重启 嵌入 新型网络 关系信息 网络数据 迭代 学习 重复 网络
【说明书】:

发明提出一种重启式随机游走的新型网络嵌入学习方法,包括以下步骤:步骤1,获取实体及其关系信息建立网络数据;步骤2,重复迭代进行游走和训练;所述步骤2中包括重启式随机游走和网络嵌入训练两部分。

技术领域

本发明涉及一种网络嵌入方法,具体涉及一种重启式随机游走的新型网络嵌入学习方法。

背景技术

网络数据形式可以自然地表达物体和物体间的联系,是我们生产生活中最为常见的一种信息载体,在我们的日常生活与工作中无处不在。例如,新浪微博数据、微信数据等构成了人与人之间的社交网络;城市之间的道路设施连接数据等构成了交通网络;淘宝、天猫、京东等购物平台数据构成了电商网络;论文之间的互相引用关系构成了引用网络,等等。基于网络数据的广泛存在,对这类网络信息进行研究与分析具有非常实际的应用价值和非常广泛的应用场景,如节点分类、链接预测、社区发现、知识图谱、推荐系统、相似度检测等等。在有关网络分析与挖掘的技术研究中,一个重要的问题就是如何合适的表示网络的拓扑结构信息,也就是网络嵌入。传统的网络表示一般使用高维的稀疏向量,但是高维稀疏的表示也成为了人们使用统计学习方法时的局限所在,因为高维的向量将会花费更多的运行时间和计算空间。尤其是近年以来,伴随着信息技术的蓬勃发展和大数据时代的到来,大量不同领域、不同地域、不同时域的信息形成了规模庞大、错综复杂的网络数据,例如,2018年,新浪微博用户数达到3.37亿,微信用户达到10.4亿,这些超大规模的网络数据大大增加了网络表示学习的难度和成本。因此,探索研究能够更好地研究分析复杂网络中的拓扑结构关系,寻找解决超大规模网络背景下的网络嵌入方法,是非常必要和有价值的。

发明内容

当前针对超大规模网络数据的网络嵌入技术还存在非常大的挑战和困难。本发明针对超大规模网络,通过重启式随机游走与自然语言处理相关技术相结合,方便、快速、高效、准确地嵌入网络结构信息,获取网络嵌入表示。为了实现上述的发明目的,本发明提出一种重启式随机游走的新型网络嵌入学习方法。图1所示为本发明的流程图,包括以下步骤:

步骤1,获取实体及其关系信息建立网络数据;

步骤2,重复迭代进行游走和训练;

所述步骤2中包括重启式随机游走和网络嵌入训练两部分。

本发明应用重启式随机游走方法依次从网络的每一个节点出发,进行随机游走跳转过程,并且在游走过程中以一定的概率返回起始节点,即重启随机游走过程。相较于普通的随机游走技术,这种重启做法能够加大临近节点的权重,即使得邻居中的节点权重随着跳数增加而递减,从而保证越近的节点的影响越大,越远的节点的影响越小,并且,这种影响变化可以通过重启概率来进行调节。本发明能够高效效用于超大规模复杂网络,能够天然的采用并行处理,同时启动多个随机游走过程在同一个网络中进行游走,空间复杂度和时间复杂度都非常低;由于重启式随机游走是从一个节点出发逐渐向外扩散,因此只需要局部结构信息即可,而不需要全局网络信息,能够有效扩展到超大规模网络中。

附图说明

图1为本发明的整体流程图;

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明提出一种重启式随机游走的新型网络嵌入学习方法。图1所示为本发明的流程图,包括以下步骤:

步骤1,获取实体及其关系信息建立网络数据;

步骤2,重复迭代进行游走和训练;

所述步骤2中包括重启式随机游走和网络嵌入训练两部分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910113316.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top