[发明专利]一种基于深度学习的隐含关系发现方法有效
申请号: | 201711469074.X | 申请日: | 2017-12-29 |
公开(公告)号: | CN108228782B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 赵中英;刘文强;李超 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/2458;G06F40/30;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 种艳丽 |
地址: | 266590 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 隐含 关系 发现 方法 | ||
本发明公开了一种基于深度学习的隐含关系发现方法,属于信息技术领域,具体包括从学者发表网络G中生成论文合著网络G’;计算论文发表情况矩阵C,D,S以及论文的合著矩阵XS,XD,XT;提出了RGRU模型;在RGRU的基础上设计并构建tARMM模型来预测“导师‑学生”关系。本发明提出的tARMM模型在数据集上的预测准确度高于其他方法,能达到95%左右,对于其他具有时间依赖性的社会关系挖掘具有一定的借鉴意义和参考价值。
技术领域
本发明属于信息技术领域,具体涉及一种基于深度学习的隐含关系发现方法。
背景技术
随着Facebook、Twitter、微信等社交媒体的普及和推广,社交媒体已经成为人们之间交流交互的重要平台。不同类型的社会关系对人有着不同的影响,人们的生活、学习和工作在这些关系的潜移默化之下发生着改变,比如在社交网络中,人们的喜好会受到朋友的影响,学生的研究方向会受到导师的影响。同时,在这些关系中还隐含着大量的额外信息,比如通过研究“导师-学生”关系,可以挖掘学术团体,建立科研社区网络,进一步了解相关研究课题的发展历程,找到下一步的发展方向。
网络中有很多的显式关系,如朋友关系、关注关系、评论关系、回复关系等,然而,也有很多关系是隐含在网络中的,如:“导师-学生”关系隐含在论文合著网络中。论文合著网络是科研人员在合作出版文献过程中逐渐形成的合作关系网络,比如DBLP。目前,有若干的项目以维护关系作为自己的目标,比如LinkedIn和AI家谱。前者要求用户对每一个特殊的对象进行标注,比如同事、导师、学生等,后者同样采用手工标注的方法对研究领域的导师信息进行标注。显然,这些方法大量依赖于人工的标注,不仅效率低,准确性也不高,这大大限制了其推广能力。对于这种现象一个理想的解决方案是设计一种方法,自动从网络中挖掘或预测出其中隐含的关系。
在论文合著网络中,想要仅从出版名单中判断谁是导师是比较困难的。有时根据直觉的假设,采用启发式规则可以在某些社交网络中区分关系类型。但是,研究发现使用典型的启发式规则只能达到精度为70-80%,即使是使用基于多个不同特征训练的多个规则结合监督学习模型,精度平均仍然只有80%,而且,在实践训练中它往往是很难收集监督信息的。
论文合著网络中的“导师-学生”关系具有如下几个特性:
1.隐含性。“导师-学生”关系是隐藏在论文合著网络中的,在论文合著网络中,只有论文的合作者、论文的题目、论文的发表时间、论文发表的刊物/会议等信息,无法显式地知道合作者之间的“导师-学生”关系。
2.时间依赖性。导师-学生关系具有高度的时间依赖性,对于任何一个作者来说,在其众多的合作者中,早期的合作者比后期的合作者更有可能是其导师。此外,一个人可以从学生的角色转化为导师角色,而这个角色转变可能没有任何明显的迹象。
3.难推测性。由于论文合著网络仅具有合作出版论文的相关信息,与其他社交媒体相比是非常简单的,同时因为“导师-学生”关系隐藏在论文合著网络中,这就导致在论文合著网络中人工地去推断“导师-学生”关系是比较困难的。
近年来,社交关系研究引起了学术界的广泛关注。当前对社交关系的研究工作可以分为三个方面:社交关系预测、社交关系类型识别和关系的交互预测。
社交关系预测,又称为链路预测,是指根据网络中节点的特征或已经存在的边,预测两个节点间存在边的可能性。Liben-Nowell等针对特定的社交网络,基于图的相似性度量方法计算节点之间的相似性,再利用该相似性预测节点之间的链接可能性。Lee等提出一种计算代价较小的基于社交向量时钟特征的模型来解决链接预测问题。Cunchao Tu等提出CANE模型,通过对用户相关的文本数据信息进行网络嵌入从而达到链路预测的目标。Backstrom等针对社交关系的强度问题提出了基于监督学习的随机游走算法。Zhao等提出一种基于“可靠路径”的预测方法,这是少数适用于加权网络的预测方法之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711469074.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:广告屏推荐方法、装置与系统
- 下一篇:页岩气井数据采集方法及装置