[发明专利]学者迁徙路线构建方法及装置有效

申请号：	202010311548.3	申请日：	2020-04-20
公开（公告）号：	CN111538917B	公开（公告）日：	2022-08-26
发明（设计）人：	唐杰;邵洲;袁莎;刘德兵	申请（专利权）人：	清华大学
主分类号：	G06F16/9537	分类号：	G06F16/9537;G06F16/951
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	王艳斌
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	学者迁徙路线构建方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种学者迁徙路线构建方法及装置，其中，方法包括以下步骤：将论文信息转化为隶属信息；在隶属信息进行向量化处理，并通过深度学习方式确定每个学者的在每个工作地点的可能性概率；根据可能性概率使用工作地点选择机制和补充缺失地点生成学者迁徙路线。该方法可以利用科研大数据中学者的科研成果信息和合作关系网络中蕴含的信息生成准确率较高的学者迁徙路线，能够很好地利用数据中的隐含信息，识别不正确的工作地点，有效提高迁徙路线构建的准确性，简单易实现。

技术领域

本发明涉及计算机网络信息技术领域，特别涉及一种学者迁徙路线构建方法及装置。

背景技术

传统的学者迁徙路线的构建主要是经过人工处理或者较粗粒度的处理，如进行国家层面的宏观分析等。Moedet等人提出了基于Scopus的同行评议期刊上发表论文的作者所属国家的方法进行学者迁徙分析。近年来，Shao等人提出了使用科研大数据还原学者迁徙的思路，并构建了一个简单的框架。其主要思想是利用学者的论文信息，但是其准确率并不是很高。Markova等人Web of Science的数据研究俄罗斯学者在全球的流动。

这些方法大多都用到了学者的科研成果信息，但是没有考虑学者命名排歧、数据噪声等一系列的问题，往往只能反映现象，并不能很好地提高学者迁徙的准确性，有待解决。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种学者迁徙路线构建方法，该方法可以利用科研大数据中学者的科研成果信息和合作关系网络中蕴含的信息生成准确率较高的学者迁徙路线，能够很好地利用数据中的隐含信息，识别不正确的工作地点，有效提高迁徙路线构建的准确性，简单易实现。

本发明的另一个目的在于提出一种学者迁徙路线构建装置。

为达到上述目的，本发明一方面实施例提出了一种学者迁徙路线构建方法，包括以下步骤：将论文信息转化为隶属信息；在所述隶属信息进行向量化处理，并通过深度学习方式确定每个学者的在每个工作地点的可能性概率；根据所述可能性概率使用工作地点选择机制和补充缺失地点生成学者迁徙路线。

本发明实施例的学者迁徙路线构建方法，使用学者的科研成果信息及合作者关系网络为学者每一年所发表论文的工作地点建立特征向量，然后根据该特征向量判断该地点的正确性，并根据框架所构建的上下文估计学者正确的工作地点，以还原学者的迁徙路线实现学者迁徙路线的构建，从而利用科研大数据中学者的科研成果信息和合作关系网络中蕴含的信息生成准确率较高的学者迁徙路线，能够很好地利用数据中的隐含信息，识别不正确的工作地点，有效提高迁徙路线构建的准确性，简单易实现。

另外，根据本发明上述实施例的学者迁徙路线构建方法还可以具有以下附加的技术特征：

进一步地，在本发明的一个实施例中，所述将论文信息转化为隶属信息，包括：根据学者-论文-合作者-隶属机构每年关系，将学者s所有论文P及合作者的论文P'中的每一篇p中的学者A和隶属B转化为B＝A*U的形式；将所述学者s所有论文P及合作者的论文P'中的affiliation编码为经纬度信息；对所有affiliation中的机构进行抽取，并转化为学者ID、机构名称、年份、地理位置信息的四元组。

进一步地，在本发明的一个实施例中，所述通过深度学习方式确定每个学者的在每个工作地点的可能性概率，包括：根据所述四元组和学者合作关系网络对所述隶属信息进行向量化处理；采用基于深度学习的方法输入向量并计算每一组向量的为真的概率，以输出的结果为候选集C，每一年学者对应的候选集为C_y，C_y表示学者这一年可能呆的工作地点及其概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010311548.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种适于移动扫码支付的终端及其实现方法
下一篇：一种智能手机与智能车机互联及控制的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]学者迁徙路线构建方法及装置有效

专利文献下载