[发明专利]一种图深度学习中高维稀疏特征的处理方法和系统有效
申请号: | 202010384220.4 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111291870B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 葛志邦;胡志洋;张大龙;黄鑫;宋宪政;马其浩;王琳 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 中高 稀疏 特征 处理 方法 系统 | ||
本说明书实施例公开了一种图深度学习中高维稀疏特征的处理方法及系统。所述方法包括:获取至少一个样本,并确定图数据中与所述至少一个样本对应的子图;遍历所述子图,从所述子图的节点获取非零特征;从参数机器中获取与所述非零特征对应的映射参数;其中,所述参数机器为模型训练过程中存放模型参数的机器,所述映射参数为将所述非零特征对应的高维向量映射到低维向量时所使用的参数;训练神经网络模型,对所述非零特征对应的映射参数进行优化,得到训练好的神经网络模型。
技术领域
本说明书涉及信息技术领域,特别涉及一种图深度学习中高维稀疏特征的处理方法和系统。
背景技术
图数据广泛存在于公司的各个业务中,图深度学习是处理图数据的有效工具。图深度学习的一个关键步骤是将图数据中的节点特征映射到低维向量,每一维特征需要用到一组映射参数。映射参数和其他模型参数一同存储在参数机器中。在每一步模型训练中,训练机器从参数机器端读取参数,进入模型,得到参数的梯度值,并将梯度值返回参数机器端用于参数的更新。由于业务的特性,图数据中的节点特征可能有几千万维甚至上亿维,相对应的就有几千万维甚至上亿组映射参数,每一步模型训练都需要将这些参数从参数机器读回训练机器,需要大量的网络通信,导致绝大部分时间都花在参数的网络传输上,影响模型训练效果。
因此,期望一种图深度学习中高维稀疏特征的处理方法和系统。
发明内容
本说明书实施例之一提供一种图深度学习中高维稀疏特征的处理方法。所述方法包括:获取至少一个样本,并确定图数据中与所述至少一个样本对应的子图;遍历所述子图,从所述子图的节点获取非零特征;从参数机器中获取与所述非零特征对应的映射参数;其中,所述参数机器为模型训练过程中存放模型参数的机器,所述映射参数为将所述非零特征对应的高维向量映射到低维向量时所使用的参数;训练神经网络模型,对所述非零特征对应的映射参数进行优化,得到训练好的神经网络模型。
本说明书实施例之一提供一种图深度学习中高维稀疏特征的处理系统,所述系统包括:第一获取模块用于获取至少一个样本,并确定图数据中与所述至少一个样本对应的子图;第二获取模块用于遍历所述子图,从所述子图的节点获取非零特征;传输模块用于从参数机器中获取与所述非零特征对应的映射参数;其中,所述参数机器为模型训练过程中存放模型参数的机器,所述映射参数为将所述非零特征对应的高维向量映射到低维向量时所使用的参数;以及训练模块用于训练神经网络模型,对所述非零特征对应的映射参数进行优化,得到训练好的神经网络模型。
本说明书实施例之一提供一种图深度学习中高维稀疏特征的处理装置,其中,所述装置包括至少一个处理器和至少一个存储设备;所述至少一个存储设备用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如权利要求1~5中任一项所述的方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的图深度学习中高维稀疏特征的处理系统的模块图;
图2是根据本说明书一些实施例所示的图深度学习中高维稀疏特征的处理方法的示例性流程图;
图3A是根据本说明书一些实施例所示的子图的示例性示意图;
图3B是根据本说明书一些实施例所示的子图的示例性示意图;以及
图4是根据本说明书一些实施例所示的查询映射表的示例性示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010384220.4/2.html,转载请声明来源钻瓜专利网。