[发明专利]网络结构的顶点编码方法、装置、设备及计算机可读介质在审
申请号: | 201910295127.3 | 申请日: | 2019-04-12 |
公开(公告)号: | CN111833200A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 潘剑飞;戴明洋;杨胜文;石逸轩;周俊;许金泉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 丁银泽;张臻贤 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 结构 顶点 编码 方法 装置 设备 计算机 可读 介质 | ||
本发明提出一种网络结构的顶点编码方法、装置、设备和计算机可读介质,所述方法包括:获取网络结构的顶点的相似性损失函数;获取所述顶点的社区性损失函数;根据所述相似性损失函数和社区性损失函数确定顶点的整体损失函数;计算所述整体损失函数的最小值;利用所述整体损失函数的最小值,获取顶点的编码。本发明实施例的网络结构的顶点编码方法可以同时维护不同顶点的相似性和社区性,在对顶点进行社区分类和聚类上可以提高准确率,从而可以在实际中更好的用于信息推荐、相似度和社区发现等任务中。
技术领域
本发明涉及数据分析技术领域,尤其涉及一种网络结构的顶点编码方法及装置、设备和计算机可读介质。
背景技术
现实中的交互关系,比如人与人之间的关系、人与物之间的喜好关系等都能构成网络结构的形式。所述网络结构中的各个主体可以表示为该网络结构中的顶点。通过所述网络结构可以表征人与人之间的相似性、人与物之间的爱好关系。其中,所述网络结构中的各个主体可以通过表征学习将其转化为向量的形式,同时向量之间保存原本人和物的特性。
然而如今的表征学习能大体表示人和物的特性,但是在表征学习过程很难为人或物之间的交互或者喜好的社区关系性。
发明内容
本发明实施例提供一种网络结构的顶点编码方法、装置、设备及计算机可读介质,以解决或缓解现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种网络结构的顶点编码方法,包括:
获取网络结构的顶点的相似性损失函数;
获取所述顶点的社区性损失函数;
根据所述相似性损失函数和社区性损失函数确定顶点的整体损失函数;
计算所述整体损失函数的最小值;
利用所述整体损失函数的最小值,获取顶点的编码。
在一种实施方式中,所述获取网络结构的顶点的相似性损失函数,包括:
获取顶点之间的相似性特征,所述相似性特征表达为:
其中,S(i)表示顶点的第i阶的相似矩阵;ωi表示第i阶相似矩阵的权重值;表示k阶相似矩阵的权重和;
根据顶点之间的相似性特征获取相似性损失函数,所述相似性损失函数表示为:
n表示顶点个数,表示对顶点i和顶点j综合k阶相似矩阵的相似程度,表示顶点i和顶点j进行编码后的余弦相似度。
在一种实施方式中,所述获取所述顶点的社区性损失函数,包括:
确定顶点的社区归属概率,所述社区归属概率表示为:
其中U表示目标顶点,Unm表示图中n个顶点的编码为m维;C表示社区;Ckm表示k个社区的编码为m维;Q表示每个顶点的社区的归属概率;
根据顶点的社区归属概率获取顶点的社区损失函数,所述损失函数表示为:
其中,n表示顶点数量;Ri表示第i个顶点获取到的奖励向量;γ为超参,表示差距率;Q′i表示基于当前顶点动作决策后第i个顶点归属社区的概率;Qi表示第i个顶点归属社区的概率。
在一种实施方式中,所述整体损失函数表示为:
Ltotal=Lproximity+α·LQ。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910295127.3/2.html,转载请声明来源钻瓜专利网。