[发明专利]基于自然语言处理和社交网络的科研成果归属预测方法及系统在审
申请号: | 202310383084.0 | 申请日: | 2023-04-11 |
公开(公告)号: | CN116644833A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 胡轶宁;吴星灿;李超;孙吉祥;王有东;陈超;唐洁;原欣;李春阳;吴丹丹;朱海建;李亚楠 | 申请(专利权)人: | 东南大学;江苏省未来网络创新研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06F18/214;G06F18/243;G06F18/2415;G06F16/35;G06F40/284;G06N5/04 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶倩 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 处理 社交 网络 科研成果 归属 预测 方法 系统 | ||
本发明公开了一种基于自然语言处理和社交网络的科研成果归属预测方法及系统,首先,基于现有的科研成果认领平台构建训练样本库,再基于预训练模型训练二分类任务模型,并构建科研人员合作网络,构建科研成果属性过滤模块,最后通过对未认领科研成果进行归属打分的方式完成科研成果的归属预测。本发明能够充分利用科研成果之间的发展关系和科研人员之间合作的信息,更加准确的得到科研成果的归属预测结果,减少人工参与的同时大大提高成果归属预测的准确性。
技术领域
本发明属于信息技术领域,主要涉及了一种基于自然语言处理和社交网络的科研成果归属预测方法及系统。
背景技术
科研成果主要包括学术论文、发明专利、专著等,成果归属即把科研成果的作者与作者位次进行确定。在科研成果展示系统中,为了展现科研人员的科研学术成果,需要科研人员在成果认领平台认领已经发表的科研成果。但是由于科研成果具有时效性,科研人员通常不会主动认领过去已经不计入考核的科研成果,而历史成果数量众多、类型复杂,也无法通过科研管理人员进行确认,因而,众多的成果归属无法确认,为科研成果的可视化展示和平台后续对成果的分析造成了困难。所以在科研成果展示领域,迫切需要一个能对众多科研成果进行归属预测的方法,能够分析最新的科研成果的归属,为科研人员的成果认领提供智能推荐,也可以预测过去科研成果的数据,用于对成果的展示与分析。
现在,学术界越来越多的关注到科研成果归属预测的问题,例如已公开的中国发明专利申请CN114416959A“一种科研成果推送、认领方法及系统”。传统的成果归属预测方法只考虑成果的各类字段与作者的画像是否匹配,通常用科研成果的第一标签匹配作者,匹配不到或者匹配到多个作者的时候再用第二标签匹配作者,以此类推。这种做法的不足之处在于只考虑了科研成果(论文、专利、著作等)的单位、作者名称、期刊类型、成果关键字和科研工作者的单位、名称、关键字是否匹配,而对于科研人员认领成果这个行为本身价值,科研成果先后之间的联系以及科研工作者的合作关系网络没有办法顾及到,这样做的问题在于:
1.难以利用科研人员已经认领的成果与潜在成果之间的联系来确认成果的分配。科研人员的研究内容往往随着时间不断演化,同一个科研人员的成果往往不是毫无联系的,时间上相近的成果,研究领域通常较为相似或者具有一定的联系。
2.难以利用科研合作者的社交网络中包含的信息。科研成果的产出往往依靠科研人员合作,成果通常会有较多的作者,通过这些科研人员之间合作可以构建出社交网络。在实际合作关系中,往往科研人员之间的合作次数都不止一次,且社交网络呈现出社区化的情况。
随着近些年预训练模型在自然语言处理领域的重要进展,使用任务语料对模型进行少许训练即可构建适用的模型。这样通过自然语言处理的文本语义对比方式可以挖掘出科研成果之间的联系,作为科研成果作者分配的影响因素之一;同时,科研人员之间合作关系网络可以作为已经确认其中部分作者的科研成果的其他作者的归属预测的影响因素之一,更加符合科研成果逐步提升更新、群策通力合作的特点。
发明内容
本发明正是针对现有技术中科研成果归属预测时未考虑成果时间特征及科研合作关系,匹配特征单一的问题,提供一种基于自然语言处理和社交网络的科研成果归属预测方法及系统,首先,基于现有的科研成果认领平台构建训练样本库,再基于预训练模型训练二分类任务模型,并构建科研人员合作网络,构建科研成果属性过滤模块,最后通过对未认领科研成果进行归属打分的方式完成科研成果的归属预测。本发明能够充分利用科研成果之间的发展关系和科研人员之间合作的信息,更加准确的得到科研成果的归属预测结果,减少人工参与的同时大大提高成果归属预测的准确性。
为了实现上述目的,本发明采取的技术方案是:基于自然语言处理和社交网络的科研成果归属预测方法,包括如下步骤:
S1,训练样本库建立:基于现有的成果认领平台,为每个已经认领过科研成果的科研人员构建成果集合,所述成果集合中,将同一科研人员的同一类型成果按照时间排序形成列表L;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学;江苏省未来网络创新研究院,未经东南大学;江苏省未来网络创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310383084.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理