[发明专利]针对关系网络的特征信息提取方法及装置有效
申请号: | 201911288471.6 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111046299B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 曹绍升;崔卿 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q30/0601;G06Q50/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 关系 网络 特征 信息 提取 方法 装置 | ||
本说明书实施例提供了一种针对关系网络的特征信息提取方法及装置。关系网络表征多个实体对象之间的关联关系,节点代表实体对象,利用关系网络包括的N个节点以及节点之间的连接边可以对应得到N*N维邻接矩阵;对邻接矩阵进行降维,使得得到的映射矩阵的行数或者列数为预设的节点向量维数D,且节点向量维数D小于N;对映射矩阵进行正交化处理,使得得到的正交化矩阵进一步提取邻接矩阵中的重要信息,再对正交化矩阵进行特征值分解,利用特征值分解结果确定邻接矩阵对应的节点向量矩阵,确定的节点向量矩阵中的节点向量可以表征实体对象的特征信息。其中,关系网络包含个人数据。
技术领域
本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及针对关系网络的特征信息提取方法及装置。
背景技术
关系网络是对现实世界中实体节点之间连接关系的描述,其广泛应用于各种计算机信息处理中。关系网络包含节点以及节点之间的连接边,节点可以对应于现实世界中的实体。例如,节点可以代表用户或物品等。不同节点之间存在连接关系时,其间即可以形成连接边。例如,不同用户之间通过电话号码进行过通话,则两个用户之间可以形成连接边;某用户购买过某物品,则该用户与该物品之间可以形成连接边,等等。因此,关系网络包含了个人数据。基于关系网络提取的节点向量,包含了关系网络中个人数据的特征信息,即可以使用节点向量来表征个人数据的特征信息。
希望能有改进的方案,更为高效地从关系网络中提取实体对象的特征信息,以便进行基于关系网络的进一步分析。
发明内容
本说明书一个或多个实施例描述了针对关系网络的特征信息提取方法及装置,以便在尽可能从关系网络中提取到准确的特征信息的情况下提高特征提取时的速度。
第一方面,实施例提供了一种针对关系网络的特征信息提取方法,通过计算机执行,所述关系网络表征多个实体对象之间的关联关系,并且包括N个代表所述实体对象的节点以及节点之间的连接边,方法包括:
获取用于表征所述关系网络中节点之间的连接边信息的N*N维邻接矩阵;
对所述邻接矩阵进行降维,得到映射矩阵,以使得所述映射矩阵的行数或者列数为预设的节点向量维数D;其中,所述节点向量维数D小于N;
对所述映射矩阵进行正交化处理,得到提取的邻接矩阵的正交化矩阵;
对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵;其中,所述节点向量矩阵由N个节点的节点向量构成,所述节点向量表征所述实体对象的特征信息,用于利用机器学习进行业务处理。
在另一种实施方式中,对所述邻接矩阵进行降维,得到映射矩阵的步骤,包括:
获取随机矩阵;其中,所述随机矩阵的行数或列数为所述预设的节点向量维数D;
将所述邻接矩阵通过所述随机矩阵进行映射,得到所述映射矩阵。
在另一种实施方式中,所述获取随机矩阵的步骤,包括:
按照以下分布之一生成随机矩阵中的元素数据:高斯分布,泊松分布,均匀分布。
在另一种实施方式中,所述对所述映射矩阵进行正交化处理,得到提取的所述邻接矩阵的正交化矩阵的步骤,包括:
对所述映射矩阵进行正交分解,得到列正交矩阵;
将所述邻接矩阵通过所述列正交矩阵进行映射,得到提取的所述邻接矩阵的正交化矩阵。
在另一种实施方式中,所述对所述正交化矩阵进行特征值分解,利用特征值分解结果确定所述邻接矩阵对应的节点向量矩阵的步骤,包括:
对所述正交化矩阵进行奇异值分解,基于得到的左奇异矩阵确定特征向量矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911288471.6/2.html,转载请声明来源钻瓜专利网。