[发明专利]一种社交网络中的链接预测方法在审
申请号: | 202011329438.6 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112396237A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 李博涵;高寒 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 南京业腾知识产权代理事务所(特殊普通合伙) 32321 | 代理人: | 缪友益 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 中的 链接 预测 方法 | ||
本发明公开了一种社交网络中的链接预测方法,属于数据挖掘领域,包括预处理、构建上下文感知嵌入、构建链接预测候选集以及将下文感知嵌入与链接预测候选集结合进行相似度计算,本发明中,通过构建上下文感知嵌入找到用户具有相似行为模式的上下文情景,从而捕获了之前传统方法所遗漏的信息,将潜在的社会影响力实例化,提高了社交网络中链接预测的准确性,并将其与节点结构信息,得到了用户在社交网络中精确表示,提高了社交网络链路预测的准确性和性能,解决了传统的方法只考虑节点与相邻节点之间的影响力交互,并没有从整张社交网络的层面挖掘隐藏的社会影响力信息的问题。
技术领域
本发明涉及数据挖掘技术领域,具体为一种社交网络中的链接预测方法。
背景技术
随着社交网络的普及与发展,诸如Facebook、Twitter、微博等社交网络在人们的生活中扮演着越来越重要的角色,人们的社交方式和沟通理念也因此随之改变;社交网络中蕴含着大量的信息,给研究人员提供了一个前所未有的机会去探索人类的行为模式;对社交网络的研究,一直都是数据挖掘领域的热门;不同于一般的数据挖掘,社交网络中的数据具有其异构多样的特点,例如大部分人都只有很少的链接,但是有一小部分人他们的链接数量远多于其他人;又例如社群结构,社交网络里面会存在很多个小群体。
链接预测作为社交网络的基本研究问题,是为了从现有的网络中寻找潜在的链接,或者预测未来网络可能出现或断开的链接;它在许多领域可以得以应用,最典型的如推荐系统:社交网络中的好友推荐、在线购物网站的商品推荐、音乐应用中的歌曲推荐等。显然有效的链接预测,可以提升用户体验,提高用户对于应用的粘性,增加用户对社交网络的忠诚度。
传统的链接预测方法有基于相似性的方法,其主要是通过计算每对节点的相似度,以确定它们是否存在连接;这种方法的一个重要前提就是相似度越高的节点对,越倾向于存在链接;相似度主要可以分为两种,一种是通过节点的属性来度量,例如位置、年龄和性别等;另一种是通过拓扑特征来度量的相似性,例如共同邻居数量;这些方法基于这样的原理,即具有较大相似性的节点对往往更倾向于具有潜在的关系;这种方法的计算较为简单,可以快速推断出潜在的联系;但是,这些方法存在着明显的缺陷;首先,它将节点属性和拓扑特征视为独立,因此而缺乏一致性以及一个合适的能够同时使用这两种类型的相关特征来定义相似性的方法;其次,由于节点不同,模型的预测能力可能会有很大差异。
为了克服这一缺点,一些基于概率的策略方法被提出,这些方法将节点属性和拓扑特征属性作为随机变量,以从观测的网络中学习链接的概率分布,并利用假设的潜在结构来估算链接关系;但是这种方法的计算复杂,且在现实应用中很难事先获得基于概率模型所非常必要的链接分布情况,所以急需一种社交网络中的链接预测方法来解决上述问题。
发明内容
本发明提供一种结合用户节点的上下文情景信息以及节点结构信息,提高了社交网络链路预测的准确性和性能的社交网络中链接预测的方法。
为实现上述目的,本发明提供如下技术方案:一种社交网络中的链接预测方法,包括如下步骤:
S1、对社交网络进行预处理,移除社交网络中的明显噪点和未执行过任何动作的节点,并对社交网络中的缺失值进行补全;
S2、在预处理过的社交网络中构建节点对应的动作序列,形成数据集,其中,动作序列中的每个动作包括用户标识、动作项、动作主题和动作时间戳;
S3、构建上下文感知嵌入,具体为:
a、从数据集中获取用户节点对应的动作序列,计算各主题下每条边的影响因子,并结合单个用户节点的动作序列计算各主题影响标识;
b、利用各主题的影响标识的嵌入,计算对应的用户节点社交活动上下文中心嵌入;
c、基于欧氏距离模型原理构建上下文中心嵌入与主题影响标识嵌入的距离模型,根据距离模型对上下文进行聚类,将聚类结果构建成上下文感知嵌入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011329438.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于液态空气的发电系统及方法
- 下一篇:一种面向多病种的慢病协同管理系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理