[发明专利]学者迁徙路线构建方法及装置有效

专利信息
申请号: 202010311548.3 申请日: 2020-04-20
公开(公告)号: CN111538917B 公开(公告)日: 2022-08-26
发明(设计)人: 唐杰;邵洲;袁莎;刘德兵 申请(专利权)人: 清华大学
主分类号: G06F16/9537 分类号: G06F16/9537;G06F16/951
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 王艳斌
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 学者 迁徙 路线 构建 方法 装置
【说明书】:

发明公开了一种学者迁徙路线构建方法及装置,其中,方法包括以下步骤:将论文信息转化为隶属信息;在隶属信息进行向量化处理,并通过深度学习方式确定每个学者的在每个工作地点的可能性概率;根据可能性概率使用工作地点选择机制和补充缺失地点生成学者迁徙路线。该方法可以利用科研大数据中学者的科研成果信息和合作关系网络中蕴含的信息生成准确率较高的学者迁徙路线,能够很好地利用数据中的隐含信息,识别不正确的工作地点,有效提高迁徙路线构建的准确性,简单易实现。

技术领域

本发明涉及计算机网络信息技术领域,特别涉及一种学者迁徙路线构建方法及装置。

背景技术

传统的学者迁徙路线的构建主要是经过人工处理或者较粗粒度的处理,如进行国家层面的宏观分析等。Moedet等人提出了基于Scopus的同行评议期刊上发表论文的作者所属国家的方法进行学者迁徙分析。近年来,Shao等人提出了使用科研大数据还原学者迁徙的思路,并构建了一个简单的框架。其主要思想是利用学者的论文信息,但是其准确率并不是很高。Markova等人Web of Science的数据研究俄罗斯学者在全球的流动。

这些方法大多都用到了学者的科研成果信息,但是没有考虑学者命名排歧、数据噪声等一系列的问题,往往只能反映现象,并不能很好地提高学者迁徙的准确性,有待解决。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的一个目的在于提出一种学者迁徙路线构建方法,该方法可以利用科研大数据中学者的科研成果信息和合作关系网络中蕴含的信息生成准确率较高的学者迁徙路线,能够很好地利用数据中的隐含信息,识别不正确的工作地点,有效提高迁徙路线构建的准确性,简单易实现。

本发明的另一个目的在于提出一种学者迁徙路线构建装置。

为达到上述目的,本发明一方面实施例提出了一种学者迁徙路线构建方法,包括以下步骤:将论文信息转化为隶属信息;在所述隶属信息进行向量化处理,并通过深度学习方式确定每个学者的在每个工作地点的可能性概率;根据所述可能性概率使用工作地点选择机制和补充缺失地点生成学者迁徙路线。

本发明实施例的学者迁徙路线构建方法,使用学者的科研成果信息及合作者关系网络为学者每一年所发表论文的工作地点建立特征向量,然后根据该特征向量判断该地点的正确性,并根据框架所构建的上下文估计学者正确的工作地点,以还原学者的迁徙路线实现学者迁徙路线的构建,从而利用科研大数据中学者的科研成果信息和合作关系网络中蕴含的信息生成准确率较高的学者迁徙路线,能够很好地利用数据中的隐含信息,识别不正确的工作地点,有效提高迁徙路线构建的准确性,简单易实现。

另外,根据本发明上述实施例的学者迁徙路线构建方法还可以具有以下附加的技术特征:

进一步地,在本发明的一个实施例中,所述将论文信息转化为隶属信息,包括:根据学者-论文-合作者-隶属机构每年关系,将学者s所有论文P及合作者的论文P'中的每一篇p中的学者A和隶属B转化为B=A*U的形式;将所述学者s所有论文P及合作者的论文P'中的affiliation编码为经纬度信息;对所有affiliation中的机构进行抽取,并转化为学者ID、机构名称、年份、地理位置信息的四元组。

进一步地,在本发明的一个实施例中,所述通过深度学习方式确定每个学者的在每个工作地点的可能性概率,包括:根据所述四元组和学者合作关系网络对所述隶属信息进行向量化处理;采用基于深度学习的方法输入向量并计算每一组向量的为真的概率,以输出的结果为候选集C,每一年学者对应的候选集为Cy,Cy表示学者这一年可能呆的工作地点及其概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010311548.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top