[发明专利]一种基于引文、图与结构的科技文献差异生成方法在审
申请号: | 202210973133.1 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115329065A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 蔡超翔;陈景强;王凯 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35;G06F16/36;G06F16/901;G06K9/62 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 姜梦翔 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 引文 结构 科技 文献 差异 生成 方法 | ||
本发明所述的一种基于引文、图与结构的科技文献差异生成方法,步骤为:第一步,对科技文献引文进行功能标注;第二步,收集对比引文以及对应的科技文献;第三步,基于对比图方法计算句子关系得分;第四步,结合结构理论计算句子结构得分;第五步,对句子进行排序,抽取句子构成差异内容。本方法采用简单高效的无监督方法,不依赖大规模训练数据,自动生成科技文献的差异内容。
技术领域
本发明涉及自动文本摘要,自然语言处理与人工智能技术领域,具体涉及一种基于引文、图与结构的科技文献差异生成方法。
背景技术
随着研究领域内科技文献的大量发表,科研工作者越来越难以从庞大的文献库中快速熟悉领域内的发展状况以及相关变化,这给研究突破带来了极大的挑战。在此之前,也有相关的针对科技文献的文本生成工作,如科技文献的摘要生成、相关工作的生成或综述的生成等。其中,科技文献的摘要生成工作有且仅针对单篇文献来进行摘要生成,或根据其他文献对某篇已存在文献的评价进一步地对已存在文献的摘要内容进行补充;相关工作的生成和综述的生成工作相似,旨在从多篇文献中进行摘要总结工作,生成的摘要内容主要是这些多篇文献之间的相似内容,同时这些相似内容也是这些文献中的突出重点内容。然而,仅仅是单篇文献的摘要生成或相关工作及综述的生成工作并不能有效地帮助研究人员快速了解研究领域内的变化,如技术的差异、研究的趋势等。
科技文献差异生成任务这一概念在目前现有技术中还未有提出过,也无相关研究。差异生成针对科技多文献进行摘要工作,与以往工作相比较有两个关键差异。首先,科技多文献摘要,如相关工作或综述生成所要进行总结的目标文献通常是参考文献或领域相关文献,这些文献所描述的内容跨度较大,且难以确保它们之间是存在异同的;其次,目前对于多文献总结的方法,通常总结文献之间的相似内容,而不包含差异内容,科技文献的差异内容生成需要从更多的文献中提炼出相关信息,要同时考虑文献之间的异同信息,既捕捉文献之间的相同内容,又要挖掘文献之间的差异。
现有文本摘要工作中常见的关于引文的应用,其通常的工作是通过引文网络来寻找引用被引文献的相关施引文献,通过这些文献对被引文献的描述与评价,来对被引文献的摘要进行进一步补充。近来,引文功能分类在科技文献的摘要工作中也受到了关注,其旨在为科技文献中的引文进行功能识别,从而判断施引作者引用被引文献的目的;但如何将其应用在差异生成任务中,用来挖掘一组相关文献集合,需要进一步研究。
结构理论近些年在摘要任务中也得到了重视,但目前鲜有将结构理论应用于科技文献摘要工作以及将多种结构理论结合从文献间和文献内分别分析的做法。
发明内容
为解决上述技术问题,本发明提供了一种基于引文、图与结构的科技文献差异生成方法,基于引文、图与结构,采用了“对比引文”——包含了施引作者本身对被引文献的深刻理解的总结内容,来寻找一组可比较的科技文献集合;本发明还分别引入了对比图、跨文档结构理论和修辞结构理论,将图与结构理论同时考虑进差异生成工作中,以此来分析文献内以及文献间的句子结构,更全面地捕捉相关信息,为科研工作者们提供科技文献之间的差异内容。
本发明所述的一种基于引文、图与结构的科技文献差异生成方法,其特征在于,所述方法步骤为:
步骤1:整合引文功能标注方法,设计针对对比引文敏感的引文功能标注方法,对文献中的引文进行功能标注;
步骤2:从所标注的引文中筛选出对比引文,并收集与之对应的文献;
步骤3:构建文献集合的对比图,并对文献中的句子关系得分进行计算;
步骤4:结合结构理论对文献中的句子结构得分进行计算;
步骤5:综合考虑文献中的句子关系得分和句子结构得分来对句子进行排序和抽取,最终构成目标差异内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210973133.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:反应腔室和晶圆对准方法
- 下一篇:一种高回油能力的硅油离合器