[发明专利]科研社群划分及核心学者发现方法、系统、介质及终端在审
申请号: | 201910785086.6 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110674183A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 田欣;徐旻昕;翁泉飞;刘振宇;胡寅骏 | 申请(专利权)人: | 上海科技发展有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 31219 上海光华专利事务所(普通合伙) | 代理人: | 徐秋平 |
地址: | 200052 上海市徐汇区淮海中路1634*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 科研 科研合作 构建 合作 网络 数据挖掘算法 合作关系 科研课题 科研实力 评价标准 特征定量 影响因子 时效性 发现 终端 衡量 分配 团体 | ||
1.一种科研社群划分及核心学者发现方法,其特征在于,包括以下步骤:
获取学者信息;
构建学者网络图谱;所述学者网络图谱用于表征学者之间合作关系;
从所述学者网络图谱中划分出科研社群;所述科研社群内部学者关系紧密、科研社群之间关系稀疏;
基于所述科研社群和所述学者网络图谱,确定核心科研合作团体,以在所述核心科研合作团体中发现核心学者。
2.根据权利要求1所述的科研社群划分及核心学者发现方法,其特征在于,获取所述学者信息包括以下步骤:
收集文献源文件,并对所述文献源文件进行解析,以获取解析后的文献数据;
基于所述解析后的文献数据,获取所有的学者信息;
对所述所有的学者信息进行清洗,以获取所述学者信息。
3.根据权利要求1或2所述的科研社群划分及核心学者发现方法,其特征在于,所述学者信息包括学者姓名、学者所属机构、学者所属部门、学者文章关系和学者合作关系。
4.根据权利要求1所述的科研社群划分及核心学者发现方法,其特征在于,构建所述学者网络图谱包括以下步骤:
基于所述学者信息,区别同名学者,将不同的学者分别定义为不同的节点;
基于所述学者信息,获取两个所述节点之间的合作次数、合作时间和合作文章影响因子,以基于所述合作次数、所述合作时间和所述合作文章影响因子计算两个所述节点之间关系边的权重值;
将所有与所述节点相连的关系边的权重值相加,以获得用于衡量所述节点重要度的点权值;
基于所述点权值、所述节点和所述关系边的权重值构建所述学者网络图谱。
5.根据权利要求4所述的科研社群划分及核心学者发现方法,其特征在于,所述关系边的权重值的计算公式为:
其中,E表示关系边的权重值;n表示合作次数;s表示合作文章影响因子;x表示当前时间;t表示合作时间。
6.根据权利要求4所述的科研社群划分及核心学者发现方法,其特征在于,从所述学者网络图谱中划分出所述科研社群包括以下步骤:
定义社群模块度并初始化所述社群模块度为0,所述社群模块度用来作为衡量划分质量的标准;
从所述学者网络图谱上选取预设个节点作为初始中心,基于预设个所述节点,构建预设个最短路径值群;
分别计算所述学者网络图谱上除预设个所述节点外剩下的每一节点至预设个所述节点的路径长度,以获取剩下的每一所述节点至预设个所述节点的最短路径;所述路径长度为所述关系边的权重值的倒数;
将预设个所述节点分别一一划分到预设个所述最短路径值群中,并按照所述最短路径,将剩下的每一所述节点分别划分到对应预设个所述节点的所述最短路径值群中,以获取划分后的最短路径值群,基于所述划分后的最短路径值群,计算所述社群模块度的第一值;
分别取预设个所述最短路径值群中所述点权值大的节点作为新的中心,基于预设个作为新的中心的所述点权值最大的节点,重复上述步骤,以获取划分后的最短路径值群,基于所述划分后的最短路径值群,计算所述社群模块度的第二值;
将所述第一值与所述第二值进行比较;若所述第一值大于所述第二值,则以所述第一值对应的所述划分后的最短路径值群作为划分出的科研社群;若所述第一值小于所述第二值,则重复上一步,直至所述社群模块度的值最大且不再变化,以所述社群模块度值最大对应的划分后的最短路径值群作为划分出的科研社群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海科技发展有限公司,未经上海科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910785086.6/1.html,转载请声明来源钻瓜专利网。