[发明专利]一种基于深度哈希的符号社交网络嵌入方法有效
申请号: | 201910468680.2 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110210988B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 毛先领;郭佳楠;姜晓健;孙英翔;黄河燕;牟其林;邹佳 | 申请(专利权)人: | 北京理工大学;中电科大数据研究院有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 唐华 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 符号 社交 网络 嵌入 方法 | ||
本发明提出了一种基于深度哈希的符号社交网络嵌入方法,属于网络社交媒体技术领域。本方法利用三元组,同时保存网络中的正边和负边信息,并设计了端到端的深度哈希模型对三元组数据进行训练,最终得到标记社交网络中每个节点在汉明空间中的哈希码表示。通过对应哈希码在链接预测任务中的AUC值,评价网络嵌入方法的好坏。本发明方法对比现有技术,首次将深度哈希应用于网络嵌入任务当中,可以同时考虑标记网络中正边和负边信息,在两个真实标记社交网络中进行连接预测任务,显著提高了标记社交网络分析任务的效果。
技术领域
本发明涉及一种符号社交网络嵌入方法,具体涉及基于深度哈希的符号社交网络嵌入方法,属于计算机自然语言处理技术中的社交媒体领域。
背景技术
网络是表达物体和物体间联系的一种重要形式,针对网络的分析研究的一个关键问题就是研究如何合理地表示网络中的特征信息。网络表示是衔接网络原始数据和网络应用任务的桥梁。网络表示学习,负责从网络数据中学习得到网络中每个节点的向量表示,之后这些节点表示就可以作为节点的特征应用于后续的网络应用任务。
随着微信、微博、Facebook为代表的社会媒体不断发展,网络表示学习引起了学术界和工业界的广泛关注。传统的网络表示学习采用图矩阵表示,由于其稀疏性,难以应用到真实的网络中。近年来,基于机器学习的网络嵌入方法因算法效率高、极大降低网络维度的同时较好的保存了网络的结构信息,逐渐成为网络表示学习的主流方法。
为进一步降低低维空间内最近邻搜索的时间复杂度,一些基于哈希的网络嵌入方法被陆续提出,并取得了较好的成效。但是,现有的基于哈希的网络嵌入方法,在处理标记社交网络时,其仅考虑其正边信息,而忽略了负边信息。标记社交网络通常同时包含正边和负边信息,例如,Epinions允许用户为其他用户打上信任或不信任的标签;Slashdot允许用户指定其他用户为朋友或敌人。如果同时考虑正边和负边信息,可以进一步提高标记社交网络分析任务的效果。
发明内容
本发明的目的是为了解决基于哈希的网络嵌入方法在处理标记社交网络时存在损失负边信息的问题,为提高标记社交网络分析任务的效果,提出了一种基于深度哈希的符号社交网络嵌入方法,能够同时保留正边及负边信息的网络嵌入。本方法利用三元组,同时保存网络中的正边和负边信息,并设计了端到端的深度哈希模型对三元组数据进行训练,最终得到标记社交网络中每个节点在汉明空间中的哈希码表示。通过对应哈希码在链接预测任务中的AUC(Area Under the Curve,曲线下面积)值,评价网络嵌入方法的好坏。
为实现上述目的,本发明所采用的技术方案如下:
一种基于深度哈希的符号社交网络嵌入方法,从公共数据集中,分别选取一种稀疏网络(例如Slashdot)和稠密网络(例如Epinions),作为实验数据集,分别进行数据收集阶段、训练阶段和测试阶段的处理。具体如下:
步骤一、数据收集阶段。
步骤1:从实验数据集中,抽取每条边及边权,构成边集ε。
其中,边集ε={(vi,vj,eij)},vi、vj表示网络中的节点,vi、边权 eij∈{1,-1}表示正边和负边,正边条数为NP,负边条数为NN。
步骤2:根据边集ε,获得三元组集合eij=1,ejk=-1。方法如下:
步骤2.1:根据边集ε中正边和负边信息,分别构建正边图和负边图。其中,正边图表示原网络去除所有负边后的结构,相反可得到负边图。
步骤2.2:从正边图和负边图中,提取三元组(vi,vj,vk)。具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学;中电科大数据研究院有限公司,未经北京理工大学;中电科大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910468680.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户活动配对的邀请方法
- 下一篇:一种安全隐患报告系统及其方法