[发明专利]学者迁徙路线构建方法及装置有效
申请号: | 202010311548.3 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111538917B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 唐杰;邵洲;袁莎;刘德兵 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/951 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王艳斌 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学者 迁徙 路线 构建 方法 装置 | ||
1.一种学者迁徙路线构建方法,其特征在于,包括以下步骤:
将论文信息转化为隶属信息,所述隶属信息通过四元组表示,所述四元组为(S,P,C,P'),其中,S是学者集合,P是学者集合S所对应的每年的学术成果信息,C是学者集合S的合作者关系网络,表示每一年这些学者和哪些学者合作了哪些论文,P'是其合作者对应的每年的科研成果信息;
在所述隶属信息进行向量化处理,并通过深度学习方式确定每个学者的在每个工作地点的可能性概率,其中,所述通过深度学习方式确定每个学者的在每个工作地点的可能性概率,包括:
根据所述四元组和学者合作关系网络对所述隶属信息进行向量化处理,
采用基于深度学习的方法输入向量并计算每一组向量的为真的概率,以输出的结果为候选集C,每一年学者对应的候选集为Cy,Cy表示学者这一年可能呆的工作地点及其概率;以及
根据所述可能性概率使用工作地点选择机制和补充缺失地点生成学者迁徙路线,其中,采用预设公式对学者职业生涯中所在的单位进行选择,并将计算得出的s学者所有的wpy按照时间的先后顺序进行排列成所述学者迁徙路线,所述预设公式为:
其中,Cy是y年的机构候选集,μ是作者隶属单位的分布,ly和ry是y年之前和y年之后第一个机构候选集左边不为空的年份,Cly和Cry分别表示其对应的候选集。
2.根据权利要求1所述的方法,其特征在于,所述将论文信息转化为隶属信息,包括:
根据学者-论文-合作者-隶属机构每年关系,将学者s所有论文P及合作者的论文P'中的每一篇p中的学者A和隶属B转化为B=A*U的形式;
将所述学者s所有论文P及合作者的论文P'中的作者隶属单位编码为经纬度信息;
对所有作者隶属单位中的机构进行抽取,并转化为学者ID、机构名称、年份、地理位置信息的四元组。
3.一种学者迁徙路线构建装置,其特征在于,包括:
信息映射模块,用于将论文信息转化为隶属信息,所述隶属信息表示为(S,P,C,P'),其中,S是学者集合,P是学者集合S所对应的每年的学术成果信息,C是学者集合S的合作者关系网络,表示每一年这些学者和哪些学者合作了哪些论文,P'是其合作者对应的每年的科研成果信息;
概率计算模块,用于在所述隶属信息进行向量化处理,并通过深度学习方式确定每个学者的在每个工作地点的可能性概率,其中,所述概率计算模块进一步用于根据所述四元组和学者合作关系网络对所述隶属信息进行向量化处理;采用基于深度学习的方法输入向量并计算每一组向量的为真的概率,以输出的结果为候选集C,每一年学者对应的候选集为Cy,Cy表示学者这一年可能呆的工作地点及其概率;以及
迁徙路线生成模块,用于根据所述可能性概率使用工作地点选择机制和补充缺失地点生成学者迁徙路线,其中,所述迁徙路线生成模块进一步用于采用预设公式对学者职业生涯中所在的单位进行选择,并将计算得出的s学者所有的wpy按照时间的先后顺序进行排列成所述学者迁徙路线,所述预设公式为:
其中,Cy是y年的机构候选集,μ是作者隶属单位的分布,ly和ry是y年之前和y年之后第一个机构候选集左边不为空的年份,Cly和Cry分别表示其对应的候选集。
4.根据权利要求3所述的装置,其特征在于,所述信息映射模块进一步用于根据学者-论文-合作者-隶属机构每年关系,将学者s所有论文P及合作者的论文P'中的每一篇p中的学者A和隶属B转化为B=A*U的形式;将所述学者s所有论文P及合作者的论文P'中的作者隶属单位编码为经纬度信息;对所有作者隶属单位中的机构进行抽取,并转化为学者ID、机构名称、年份、地理位置信息的四元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010311548.3/1.html,转载请声明来源钻瓜专利网。