[发明专利]一种基于深度学习的隐含关系发现方法有效
申请号: | 201711469074.X | 申请日: | 2017-12-29 |
公开(公告)号: | CN108228782B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 赵中英;刘文强;李超 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/2458;G06F40/30;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 种艳丽 |
地址: | 266590 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 隐含 关系 发现 方法 | ||
1.一种基于深度学习的隐含关系发现方法,其特征在于:对隐含关系挖掘问题作出形式化的定义:
定义1学者发表网络G
将时间依赖的学者发表网络形式化表示为一个二部图,令G=(A,P,E),其中表示学者发表网络中所有作者的集合;是所有论文的集合;E={eik|1<=i<=na,1<=k<=np,ai是pk的作者},表示学者发表网络中的作者与论文的著作关系;
定义2论文合著网络G’
从G中生成G’=(A’,E′,{pnij}eij∈E'),其中,是作者集合,a0是一虚拟作者,对于作者ai,假设其导师为如果那么认为E’={eij|1<=i<=na,1<=j<=na,ai和aj具有合作关系且ai≠aj};其中,pnij是与eij相关的一个向量,pnij∈R1×40表示ai和aj在某一个时间域内合著的论文数量;对于单个作者来说,使用pni可以表示作者ai论文发表情况;
定义3论文合著矩阵C
对于A中任意一作者x,假设其与m位作者具有合著关系,合作者集合用Ax表示,Ax={b0,b1,b2,…,bm},其中b0=a0;若在某一年t中,x与bj合著的论文数为则对于作者x,有合著矩阵:
其中,T为作者合作的总体时间域,本文以一年为一个时间跨度;
定义4导师学生关系R
令R={yij|0<=i<=na,0<=j<=na},表示作者之间是否是“导师-学生”关系,其具体取值如下:
所述的基于深度学习的隐含关系发现方法,具体包括如下步骤:
Input:学者发表网络G;
Output:“导师-学生”关系的预测结果;
步骤1:对学者发表网络G中的链接进行分析,从学者发表网络G中生成论文合著网络G’;
步骤2:根据论文合著网络G’,计算论文发表情况矩阵C,D,S,进而计算论文的合著矩阵XS,XD,XT;
对于论文的合著情况,从如下两个方面进行分析:
第一方面,从合著的详细情况进行分析,对于作者x,通过合著矩阵C表示x与其候选导师之间的合著论文发表情况;
候选导师的论文发表情况用D表示:
作者x的论文发表情况pnx用S表示:
S=(S0 … ST-1) (2.3);
分别利用作者和候选导师的论文发表情况对合著矩阵C进行归一化处理:
XS=C·S (2.5);
XD=D·S (2.6);
其中,XS为基于学生的合著子矩阵,XSij∈XS,表示在第j年中作者x与其候选导师bi合著论文数占作者x第j年总论文数的比例;XD为基于导师的合著子矩阵,XDij∈XD,表示在第j年中作者x与其候选导师bi合著论文数占候选导师bi第j年总论文数的比例;
第二方面,从合著的时间角度出发,根据合著矩阵C将合著情况的时间结构以矩阵的形式进行表示,具体定义如下:
XT为基于时间结构的合著子矩阵,其含义是用矩阵的形式表示作者x与其候选导师bi之间合著论文的时间结构;
步骤3:建立tARMM模型即时间感知的导师学生关系挖掘模型;
步骤4:通过tARMM模型对合著矩阵进行处理;
步骤4.1:使用更新门循环单元RGRU计算导师概率PT;
在tARMM模型中,对RNN进行改造,生成更新门循环单元RGRU,通过更新门循环单元RGRU,对XT进行处理,得到导师概率PT;
对于时刻t,有:
rt=σ(wrht+1+whxt+br) (2.9);
ht=(1-rt)ht+1+rtxt (2.10);
其中,σ指的是sigmoid激活函数,rt是更新门在时间t的状态,wr和wh均为更新门的权重矩阵,br是更新门的偏移量,ht+1是更新门单元在时刻t+1的状态,xt是时刻t的输入矩阵,ht是更新门单元在时间t的状态;
基于RGRU的导师概率PT:
PT=hT (2.11);
其中,hT是更新门单元在时间T的状态;其公式与ht相同;
具体步骤如下:
Input:论文合著矩阵XT;
Output:基于RGRU的导师概率PT;
步骤4.1.1:初始化PT为零矩阵;
步骤4.1.2:通过公式(2.9)计算t年的更新门的状态rt;
步骤4.1.3:通过公式(2.10)计算t年的更新门单元的状态ht;
步骤4.1.4:通过公式(2.11)计算x的基于RGRU的导师概率PT;
步骤4.2:使用DNN计算基于类图矩阵的导师概率PF;
通过tARMM模型,采用深度神经网络,对XS、XD进行处理,得到基于类图矩阵的导师概率PF;
将XS和XD进行组合,构成一个双颜色通道的位图,称之为类图矩阵X;目标是发现类图矩阵X中的特定图形所在的行号;由于这是一个像素级的目标定位问题,所以构建一个DNN进行识别,根据感知器的计算公式,对于DNN中的每一个节点,其输出为:
其中,wi,b为模型的权重与偏移量参数,pi为每个节点预测出的概率值;
则DNN最终产生的基于类图矩阵的导师概率PF为DNN最后一层的输出:
PF=Relu(f(XS,XD)) (2.13);
具体步骤如下:
Input:论文合著矩阵XS和XD;
Output:基于类图矩阵的导师概率PF;
步骤4.2.1:初始化PF为零矩阵;
步骤4.2.2:通过公式(2.12)计算DNN中每个节点的输出;
步骤4.2.3:通过公式(2.13)计算基于类图矩阵的导师概率PF;
步骤4.3:计算最终的导师概率P;
将基于RGRU的导师概率PT和基于类图矩阵的导师概率PF通过全连接层生成最终的导师概率矩阵,从中选取最高的概率值P,其对应的候选导师即为x的预测导师;
P=σ(PF·PT) (2.14);
步骤5:P中最大概率的候选导师即为x的预测导师,从而得到“导师-学生”关系的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711469074.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:广告屏推荐方法、装置与系统
- 下一篇:页岩气井数据采集方法及装置