[发明专利]基于Spark的节点相似度计算方法、装置及终端有效
申请号: | 201810811936.0 | 申请日: | 2018-07-23 |
公开(公告)号: | CN110751161B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 魏红亮 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F18/22 | 分类号: | G06F18/22 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 潘彦君 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种基于Spark的节点相似度计算方法、装置及终端,方法包括:获取待处理的二部图中的节点数据,对节点数据进行序列化处理;根据处理后的节点数据生成概率转移矩阵和相似度矩阵;对概率转移矩阵和相似度矩阵进行多级自适应分片迭代处理,获得中间结果矩阵;将中间结果矩阵与预先设置的衰减系数做乘积运算,获得最终结果矩阵;根据最终结果矩阵获得节点之间的相似度。本发明提供的技术方案,具体为一种基于Spark的大规模矩阵乘法算法,能够对数据进行多级自适应分片,并可以将Simrank计算公式过程拆分为两部分,降低了计算规模和中间数据存储规模;从而能够高效地计算亿级别节点之间的相似度。 | ||
搜索关键词: | 基于 spark 节点 相似 计算方法 装置 终端 | ||
【主权项】:
1.一种基于Spark的节点相似度计算方法,其特征在于,包括:/n获取待处理的二部图中的节点数据,对所述节点数据进行序列化处理;/n根据处理后的所述节点数据生成概率转移矩阵和相似度矩阵;/n对所述概率转移矩阵和相似度矩阵进行多级自适应分片迭代处理,获得中间结果矩阵;/n将所述中间结果矩阵与预先设置的衰减系数做乘积运算,获得最终结果矩阵;/n根据所述最终结果矩阵获得节点之间的相似度。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810811936.0/,转载请声明来源钻瓜专利网。