[发明专利]一种面向学术精准推荐的异质科研信息集成方法及系统有效
申请号: | 202110732872.7 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113343125B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 张凯;王楚豫;叶保留 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/0475;G06N3/0464;G06N3/094;G06N3/084;G06F18/22 |
代理公司: | 南京泉为知识产权代理事务所(特殊普通合伙) 32408 | 代理人: | 许丹丹 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 学术 精准 推荐 科研 信息 集成 方法 系统 | ||
1.一种面向学术精准推荐的异质科研信息集成方法,其特征在于,包括以下步骤:
S1、对异质的原始科研信息进行预处理,包括:分别将异质的学术文献信息编码成向量模式,并抽取语义相关的学术特征向量,用于编码训练;并对学术特征向量的一些条目进行随机置空,构造随机异质的科研信息;
S2、对于预处理获得的学术信息特征向量和异质科研信息进行编码,并构建学术编码映射模型,所述学术编码映射模型利用多重卷积层构建生成对抗网络,用于从异质的科研信息中获得完整特征向量的映射;
S3、利用生成对抗网络的生成器部分,实现异质学术信息到学术信息特征向量的转化,将异质、存在缺失条目的科研信息进行补全并生成完整的科研信息特征向量;
S4、将作者信息编码成稀疏的独热向量,并标记作者信息的独热向量与科研信息特征向量之间的相关程度;
S5、利用作者信息的独热向量、科研信息特征向量以及作者信息的独热向量与科研信息特征向量之间的相关程度,训练协同过滤推荐模型,用于生成与作者相关的推荐集合;
S6、融合基于协同过滤的作者-文献相关性推荐以及基于生成对抗网络的文献-文献相关性推荐,得到最终的推荐结果,完成学术文献的精准推荐。
2.根据权利要求1所述的面向学术精准推荐的异质科研信息集成方法,其特征在于,所述步骤S1包括:针对特定来源的每一篇科研论文的原始信息进行预处理,抽取以下几个指标构建原始信息:
[作者1,作者2,……,作者n,研究领域,论文名称,论文关键词,收录时间,论文摘要]
将指标数据齐全的原始信息作为标签;通过将其中的随机部分字段置空,作为训练数据,将标签与训练数据一一对应,作为原始数据训练集。
3.根据权利要求2所述的面向学术精准推荐的异质科研信息集成方法,其特征在于,所述步骤S2对于预处理获得的学术信息特征向量和异质科研信息进行编码包括:将原始数据训练集中每个词语都映射成词向量Vi,将原始特征的所有信息映射之后进行堆叠,得到预处理的矩阵Mk=[Vector1,Vector2,Vector3,Vector4,......Vectorn],相应的,对于此训练数据,有标签:对于一组科研数据,则产生训练集中的多组数据
4.根据权利要求3所述的面向学术精准推荐的异质科研信息集成方法,其特征在于,所述步骤S2中学术编码映射模型使用生成对抗模型,该模型使用生成对抗学习的方式,生成器与判别器通过卷积层来对信息进行抽取,其中每一层的计算方式如下:
其中,m表示第l-1层网络输出向量的维度,表示第l-1层网络的第i个输出参数,表示第l层网络的第j个输出参数,是第l层网络的参数,是第l层的偏置,f是所选取的激活函数;
生成对抗模型的计算目标公式为:
A=argminG(argmaxDValue(G,D))
Value(D,G)=Ex~Pdata(x)[logD(x)]+Ez~Pdata(z)[1-logD(G(z))]
其中G为生成器,D为判别器,E为交叉熵误差,A表示优化目标,Value(G,D)表示在生成器为G、判别器为D的情况下计算的反向传播误差,z表示生成器输入的隐藏变量,Ex~Pdata(x)表示在x服从其原始分布Pdata(x)时,使用交叉熵对误差进行计算;同样地,Ez~Pdata(z)表示在z服从Pdata(z)分布时,使用交叉熵对误差进行计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110732872.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车后背门定位结构及其定位方法
- 下一篇:FRP筋连接装置及其连接方法